arXiv ID:
2605.10835
arXiv 提交日期: 2026-05-11
Transcoda:基于数据驱动的合成训练的端到端零样本光学乐谱识别 / Transcoda: End-to-End Zero-Shot Optical Music Recognition via Data-Centric Synthetic Training
1️⃣ 一句话总结
本文提出了一种名为Transcoda的光学乐谱识别系统,通过先进的合成数据生成、编码标准化和语法约束解码,仅用6小时在单GPU上训练一个小模型,就大幅超越了现有大型模型在合成乐谱和历史扫描乐谱上的识别准确率。