arXiv ID:
2512.07186
arXiv 提交日期: 2025-12-08
START:用于图表理解的空间与文本学习 / START: Spatial and Textual Learning for Chart Understanding
1️⃣ 一句话总结
这篇论文提出了一个名为START的新方法,通过同时学习图表的视觉空间布局和底层数据文本信息,显著提升了多模态大语言模型对图表的理解能力,并在新构建的基准测试上取得了领先性能。