🤖 系统
11-30 17:27
📄 论文总结
AHELM:音频-语言模型的全方位评估 / AHELM: A Holistic Evaluation of Audio-Language Models
1️⃣ 一句话总结
这篇论文提出了一个名为AHELM的综合评估基准,通过标准化测试方法全面衡量音频-语言模型在感知、推理、公平性等10个关键维度的表现,发现现有模型在部分能力上表现优异但仍存在公平性等问题。
请先 登录 后再提交论文
AHELM:音频-语言模型的全方位评估 / AHELM: A Holistic Evaluation of Audio-Language Models
这篇论文提出了一个名为AHELM的综合评估基准,通过标准化测试方法全面衡量音频-语言模型在感知、推理、公平性等10个关键维度的表现,发现现有模型在部分能力上表现优异但仍存在公平性等问题。