arXiv ID:
2601.17761
AR-Omni:一个用于任意模态间生成任务的统一自回归模型 / AR-Omni: A Unified Autoregressive Model for Any-to-Any Generation
1️⃣ 一句话总结
这篇论文提出了一个名为AR-Omni的统一模型,它仅用一个自回归解码器就能同时处理文本、图像和语音的生成任务,并通过创新的训练和推理方法解决了多模态统一建模中的关键难题,实现了高质量且实时的多模态生成。