arXiv ID:
2606.19157
IndicContextEval:评估音频大语言模型在8种印度语言中上下文利用能力的基准测试 / IndicContextEval: A Benchmark for Evaluating Context Utilisation in Audio Large Language Models Across 8 Indic Languages
1️⃣ 一句话总结
为了检验音频大语言模型是否真正利用文本提示中的上下文(如领域或实体列表)来提升语音识别效果,而非仅依赖模型自身记忆,作者构建了一个涵盖8种印度语言、555位发言人和23个专业领域的56小时多语言基准测试,并设计了7级渐进式提示框架,结果发现不同模型在利用上下文的能力上存在显著差异。