← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: llm
详细标签: reward-guided decoding controlled generation visual hallucination suppression object recall dynamic computation efficiency 或 搜索:

📄 论文总结


1️⃣ 一句话总结

该论文提出了一种名为多模态奖励引导解码(MRGD)的新方法,通过动态组合视觉幻觉抑制和对象召回奖励模型,在推理阶段直接控制多模态大语言模型(MLLMs)的输出质量,实现了精度-召回率的灵活权衡与计算开销的按需调节,填补了现有方法(如微调、RLHF)缺乏细粒度推理控制的空白。


2️⃣ 论文创新点

1. 多模态奖励引导解码框架(MRGD)

2. 双奖励模型设计与训练

3. 动态计算效率优化


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表


(总结基于10个chunk的整合,已合并重复表述并优化逻辑连贯性)

📄 打开原文 PDF