arXiv ID:
2510.07550
arXiv 提交日期: 2025-10-08
TRAVL:一种提升视频语言模型在物理不合理性判断能力的方案 / TRAVL: A Recipe for Making Video-Language Models Better Judges of Physics Implausibility
1️⃣ 一句话总结
本文提出了一种名为TRAVL的优化方法,通过平衡训练数据和轨迹感知注意力模块来增强视频语言模型对物理不合理性的判断能力,并创建了一个名为ImplausiBench的基准测试来更严格地评估模型的物理推理表现。