arXiv ID:
2605.28035
arXiv 提交日期: 2026-05-27
MTAVG-Bench 2.0:多说话人音视频生成中电影表现力的故障诊断基准 / MTAVG-Bench 2.0: Diagnosing Failure Modes of Cinematic Expressiveness in Multi-Talker Audio-Video Generation
1️⃣ 一句话总结
该论文提出了一个名为MTAVG-Bench 2.0的评估基准,专门用于诊断多角色音视频生成模型在表演、叙事、氛围和视听语言等电影级表现力上的常见缺陷,实验发现即使最先进的商用模型也难以应对其中的复杂故障。