arXiv ID:
2603.02789
arXiv 提交日期: 2026-03-03
OCR还是不用OCR?在MLLMs时代基于真实世界大规模数据集重新思考文档信息提取 / OCR or Not? Rethinking Document Information Extraction in the MLLMs Era with Real-World Large-Scale Datasets
1️⃣ 一句话总结
这项研究发现,对于强大的多模态大语言模型来说,直接输入文档图像进行信息提取的效果已经可以媲美传统的OCR预处理后再分析的流程,这意味着未来处理文档时可能不再需要OCR步骤。