arXiv ID:
2512.21094
arXiv 提交日期: 2025-12-24
T2AV-Compass:迈向文本到音视频生成的统一评估 / T2AV-Compass: Towards Unified Evaluation for Text-to-Audio-Video Generation
1️⃣ 一句话总结
这篇论文提出了一个名为T2AV-Compass的统一评估基准,用于全面衡量文本生成音视频系统的性能,发现现有模型在真实感和跨模态一致性上仍远不及人类水平,为未来研究指明了改进方向。