arXiv ID:
2607.02343
arXiv 提交日期: 2026-07-02
SelectTSL:复杂场景中基于提示引导的选择性目标声音定位 / SelectTSL: Prompt-Guided Selective Target Sound Localization in Complex Scenarios
1️⃣ 一句话总结
本文提出了一种名为SelectTSL的深度学习模型,能够根据用户提供的提示(如音频描述),在多个声音交错的复杂环境中,只定位用户指定的特定声源的方向和数量,而忽略其他无关声音,解决了现有技术无法同时实现选择性定位和保持空间精度的难题。