arXiv ID:
2509.04744
arXiv 提交日期: 2025-09-05
WildScore:多模态大语言模型在真实场景符号音乐推理的基准测试 / WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning
1️⃣ 一句话总结
这篇论文提出了首个针对真实世界符号音乐推理的基准测试WildScore,通过从真实乐谱和用户讨论构建的评估体系,揭示了当前多模态大模型在音乐理解方面的潜力与局限。