arXiv ID:
2606.25306
arXiv 提交日期: 2026-06-24
物理问题场景图:文本生成视频中物理合理性的细粒度评估 / Physics Question Scene Graph: Fine-grained Evaluation of Physical Plausibility in Text-to-Video Generation
1️⃣ 一句话总结
本文提出了一种名为物理问题场景图(PQSG)的分层评估方法,通过构建带有逻辑依赖的问答图,利用视觉语言模型细粒度地检测AI生成视频中违反物理规律的具体环节(如物体、动作或物理规则),实验表明该方法比现有技术更贴近人类判断,并为视频生成模型的物理真实性评测提供了新基准。