arXiv ID:
2604.20719
arXiv 提交日期: 2026-04-22
ONOTE:面向专家级音乐智能的全模态符号处理基准测试 / ONOTE: Benchmarking Omnimodal Notation Processing for Expert-level Music Intelligence
1️⃣ 一句话总结
本文提出了一个名为ONOTE的全新基准测试,它通过一种基于音高投影的确定性评估方法,客观衡量AI系统在处理音乐符号(包括听觉、视觉和符号三种模态)时的真实理解能力,并揭示了当前顶尖多模态模型在感知准确性与深层音乐逻辑之间存在的严重脱节。