arXiv ID:
2607.01737
ReQuest:基于重思考的问题感知关键帧选择用于长视频问答 / ReQuest: Rethinking-based Question-Aware Frame Selection for Long-Form Video QA
1️⃣ 一句话总结
该论文提出了一种名为ReQuest的即插即用方法,它通过一个轻量的问题感知选择器、根据模型不确定度动态触发额外计算的重思考路由以及基于不确定度的自适应非极大值抑制,从长视频中智能挑选与问题相关的关键帧,从而在无需修改底层多模态大模型的前提下,显著提升长视频问答的准确率与效率。