arXiv ID:
2606.13544
面向实时多方语音代理的自适应话轮转换 / Adaptive Turn-Taking for Real-time Multi-Party Voice Agents
1️⃣ 一句话总结
本文提出了一种名为ModeratorLM的语音代理系统,通过为系统分配明确的角色(如主持人或参与者)并利用流式语音大语言模型结合逻辑推理,显著提升了多方对话中话轮转换的准确率和召回率,同时减少了不必要的插话干扰。