arXiv ID:
2603.10910
GLM-OCR技术报告 / GLM-OCR Technical Report
1️⃣ 一句话总结
这篇论文介绍了一个名为GLM-OCR的高效轻量级多模态模型,它通过结合视觉编码器和语言解码器,并采用创新的多令牌预测机制,在保持低计算成本的同时,实现了对文档中文字、公式、表格等内容的出色识别与理解,适合在实际场景中部署。