arXiv ID:
2602.05220
arXiv 提交日期: 2026-02-05
风笛手:通过丰富描述解决开放式音频任务 / Bagpiper: Solving Open-Ended Audio Tasks via Rich Captions
1️⃣ 一句话总结
这篇论文提出了一个名为Bagpiper的通用音频基础模型,它通过将原始音频信号与全面的自然语言描述(即“丰富描述”)相互映射,无需针对特定任务进行专门训练,就能统一处理音频理解和生成等多种复杂任务。