arXiv ID:
2604.11042
arXiv 提交日期: 2026-04-13
通过智能协调改进跨不一致标注数据集的布局表示学习 / Improving Layout Representation Learning Across Inconsistently Annotated Datasets via Agentic Harmonization
1️⃣ 一句话总结
这篇论文提出了一种智能标签协调方法,利用视觉语言模型在训练前统一不同数据集中类别和标注框的标准,从而有效提升了文档布局检测模型的性能,并改善了模型学习到的特征表示。