arXiv ID:
2601.14722
arXiv 提交日期: 2026-01-21
台风OCR:面向泰语文档提取的开放视觉语言模型 / Typhoon OCR: Open Vision-Language Model For Thai Document Extraction
1️⃣ 一句话总结
这篇论文提出了一个名为Typhoon OCR的开放视觉语言模型,它专门针对泰语和英语文档,能够高效、准确地完成文本转录和版式重建,其性能媲美甚至超越更大、更昂贵的商业模型,同时保持了轻量化和易于部署的特点。