arXiv ID:
2601.11141
arXiv 提交日期: 2026-01-16
FlashLabs Chroma 1.0:一种具备个性化语音克隆功能的实时端到端口语对话模型 / FlashLabs Chroma 1.0: A Real-Time End-to-End Spoken Dialogue Model with Personalized Voice Cloning
1️⃣ 一句话总结
这篇论文提出了首个开源的实时端到端口语对话模型Chroma 1.0,它不仅能实现亚秒级的低延迟对话,还能在连续多轮对话中高质量地克隆并保持用户的个性化语音,使得语音助手听起来更像真人。