arXiv ID:
2605.30090
arXiv 提交日期: 2026-05-28
DirectorBench:借助个性化多智能体评估诊断长视频生成 / DirectorBench: Diagnosing Long-Form Video Generation with Personalized Multi-Agent Evaluation
1️⃣ 一句话总结
本文提出了一个名为DirectorBench的全新评估系统,它像一位懂行的导演,通过80个结构化指标、7种不同观众喜好和40个关键检查点,从剧本、画面、音频、跨模态和稳定性五个维度,精准诊断长视频生成中的具体问题(比如镜头切换生硬),而不是只给一个笼统的分数。