arXiv ID:
2602.03023
arXiv 提交日期: 2026-02-03
基于音乐元数据大语言模型的音乐描述生成方法再思考 / Rethinking Music Captioning with Music Metadata LLMs
1️⃣ 一句话总结
这篇论文提出了一种新的音乐描述生成方法,它先通过模型从音频中提取详细的音乐元数据,再借助大语言模型将这些元数据转换成生动的文字描述,这种方法不仅训练效率高,还能灵活调整描述风格,并支持根据部分信息补全完整的音乐标签。