← 返回列表

菜单

🤖 系统
📄 Abstract - Video-MTR: Multi-Turn Reinforcement Reasoning for Long Video Understanding
正在获取摘要...
详细标签: long video understanding multi-turn reasoning reinforcement learning video question answering reward shaping 或 搜索:

📄 论文总结

用于长视频理解的多轮强化推理框架

Video-MTR: Multi-Turn Reinforcement Reasoning for Long Video Understanding


1️⃣ 一句话总结

Video-MTR是一个端到端训练的多轮强化推理框架,通过门控双层次奖励机制迭代选择关键视频片段,有效解决了长视频理解中的长程时间依赖和多重事件挑战。


2️⃣ 论文创新点

1. 多轮推理框架

2. 门控双层次奖励系统

3. 目标门控奖励塑形


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF