📄 论文总结
PaddleOCR-VL:通过0.9B超紧凑视觉语言模型提升多语言文档解析能力 / PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model
1️⃣ 一句话总结
这篇论文提出了一种名为PaddleOCR-VL的高效文档解析模型,其核心是一个仅0.9B参数的紧凑视觉语言模型,能准确识别109种语言中的文本、表格、公式和图表等复杂元素,并在性能和速度上超越现有方案,适合实际部署。