arXiv ID:
2606.24484
arXiv 提交日期: 2026-06-23
推动面向艺术字的场景文字识别:数据集与方法 / Advancing WordArt-Oriented Scene Text Recognition: Datasets and Methods
1️⃣ 一句话总结
该论文针对艺术字(WordArt)的高度定制化风格给传统场景文字识别带来的挑战,从数据和模型两方面入手:构建了一个包含200万样本的大规模合成数据集WATER-S,并提出了一种支持任意形状输入和自回归解码的识别模型WATERec,最终在艺术字识别基准上达到了90.40%的准确率,远超现有通用和OCR专用模型。