arXiv ID:
2603.09160
arXiv 提交日期: 2026-03-10
RubiCap:基于评分标准的强化学习用于密集图像描述生成 / RubiCap: Rubric-Guided Reinforcement Learning for Dense Image Captioning
1️⃣ 一句话总结
这篇论文提出了一种名为RubiCap的新方法,它利用大型语言模型自动生成详细的评分标准来指导强化学习训练,从而在无需昂贵人工标注的情况下,高效地生成质量更高、更多样化的图像描述。