arXiv ID:
2601.03233
arXiv 提交日期: 2026-01-06
LTX-2:高效的联合视听基础模型 / LTX-2: Efficient Joint Audio-Visual Foundation Model
1️⃣ 一句话总结
这篇论文提出了一个名为LTX-2的开源基础模型,它能够高效地生成高质量且音画同步的视频内容,通过创新的双流架构和训练机制,在保证性能的同时大幅降低了计算成本。