arXiv ID:
2510.20470
arXiv 提交日期: 2025-10-23
Conan:像侦探一样在多尺度视觉证据上进行渐进式推理学习 / Conan: Progressive Learning to Reason Like a Detective over Multi-Scale Visual Evidence
1️⃣ 一句话总结
这篇论文提出了一个名为Conan的智能视频推理框架,它通过像侦探一样逐步识别关键画面、分析跨帧线索并自主决定何时停止探索,有效解决了现有方法在视频推理中容易产生幻觉或定位不准的问题,并在多个基准测试中取得了领先的准确率。