arXiv ID:
2601.01554
arXiv 提交日期: 2026-01-04
MOSS转录与说话人分离:具备说话人归属和时间戳的精准转录 / MOSS Transcribe Diarize: Accurate Transcription with Speaker Diarization
1️⃣ 一句话总结
这篇论文提出了一个名为MOSS Transcribe Diarize的端到端多模态大语言模型,它能够同时、准确地识别会议等场景中谁在何时说了什么,并且在多项测试中超越了当前最先进的商业系统。