arXiv ID:
2602.11733
arXiv 提交日期: 2026-02-12
面向大规模电商理解的视觉-语言模型适配 / Adapting Vision-Language Models for E-commerce Understanding at Scale
1️⃣ 一句话总结
这篇论文提出了一种有效的方法,通过针对性的适配,让通用的视觉-语言模型在保持原有广泛能力的同时,能更好地处理电商场景中多图像、属性密集且数据嘈杂的商品理解任务。