arXiv ID:
2512.18099
arXiv 提交日期: 2025-12-19
SAM音频:分割任意音频 / SAM Audio: Segment Anything in Audio
1️⃣ 一句话总结
这篇论文提出了一个名为SAM Audio的通用音频分割基础模型,它能够通过文本、视觉或时间片段等多种提示方式,灵活地从混合音频中分离出目标声音(如语音、音乐或一般声响),并在多个基准测试中取得了领先性能。