← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
详细标签: reinforcement learning reward model image generation multi-task learning visual language model 或 搜索:

📄 论文总结

OneReward:基于统一奖励模型的多任务图像生成强化学习框架

OneReward: A Unified Reward Model Framework for Multi-Task Image Generation via Reinforcement Learning


1️⃣ 一句话总结

本文提出了一种名为OneReward的统一强化学习框架,使用单一视觉语言模型作为奖励模型,通过多任务强化学习直接优化预训练基础模型,在图像填充、扩展、物体移除和文本渲染等多种图像编辑任务上实现了最先进的性能。


2️⃣ 论文创新点

1. 统一奖励模型框架

2. 多任务强化学习训练

3. 多维度评估框架


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF