arXiv ID:
2512.21507
arXiv 提交日期: 2025-12-25
SVBench:视频生成模型在社会推理能力上的评估 / SVBench: Evaluation of Video Generation Models on Social Reasoning
1️⃣ 一句话总结
这篇论文提出了首个用于评估视频生成模型社会推理能力的基准SVBench,发现当前先进模型虽然在画面真实性和动作流畅度上表现优秀,但在理解人物意图、信念、共同关注等深层社会逻辑方面存在系统性不足。