arXiv ID:
2605.03361
arXiv 提交日期: 2026-05-05
ReasonAudio:评估文本-音频检索中超越匹配的推理能力的基准 / ReasonAudio: A Benchmark for Evaluating Reasoning Beyond Matching in Text-Audio Retrieval
1️⃣ 一句话总结
该论文提出了ReasonAudio,首个专门用于评估文本-音频检索中复杂推理能力(如否定理解、时间顺序、事件重叠、时长判断等)的基准测试,并通过实验发现当前最先进的模型在这些推理任务上表现不佳,尤其是否定和时长判断,且多模态大模型的嵌入方法在对比微调后丢失了原有推理能力。