arXiv ID:
2605.07492
arXiv 提交日期: 2026-05-08
文档解析离解决还有多远?PureDocBench:一个涵盖干净、退化及真实场景的可溯源源基准测试集 / How Far Is Document Parsing from Solved? PureDocBench: A Source-TraceableBenchmark across Clean, Degraded, and Real-World Settings
1️⃣ 一句话总结
本文指出现有顶尖文档解析基准测试OmniDocBench存在标注错误和过时风险,并提出了一个更可靠的自动化基准测试集PureDocBench,实验发现当前最好的模型得分也仅约74/100,说明文档解析远未解决,尤其在公式识别和图像退化场景下挑战巨大。