arXiv ID:
2604.06160
arXiv 提交日期: 2026-04-07
字符错误向量:用于页面级OCR评估的可分解错误 / The Character Error Vector: Decomposable errors for page-level OCR evaluation
1️⃣ 一句话总结
本文提出了一种名为‘字符错误向量’的新评估方法,它不仅能像传统指标一样衡量OCR的字符识别准确度,还能将整体错误分解为文本解析和字符识别等不同来源,从而帮助研究人员更精准地定位和优化文档理解流程中的薄弱环节。