arXiv ID:
2602.07833
SPD-Faith Bench:诊断与提升多模态大语言模型思维链推理的忠实性 / SPD-Faith Bench: Diagnosing and Improving Faithfulness in Chain-of-Thought for Multimodal Large Language Models
1️⃣ 一句话总结
这篇论文提出了一个名为SPD-Faith Bench的诊断基准,用于发现多模态大模型在思维链推理中存在的‘感知盲区’和‘感知-推理脱节’两大不忠实问题,并通过一种无需训练的可视化证据校准框架SAGE来提升推理的可靠性。