arXiv ID:
2511.11005
arXiv 提交日期: 2025-11-14
借助视觉专家进行草拟与精修 / Draft and Refine with Visual Experts
1️⃣ 一句话总结
这项研究提出了一种新方法,通过量化模型对图像信息的依赖程度并引入视觉专家反馈,有效减少了大型视觉语言模型在回答时凭空捏造内容的问题,从而提高了答案的准确性和可靠性。