← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
详细标签: multilingual retrieval document understanding benchmarking visual-text retrieval mllms 或 搜索:

📄 论文总结


1️⃣ 一句话总结

这篇论文提出了VisR-Bench——首个多语言、多模态的长文档视觉检索基准,通过覆盖16种语言和多样化问题类型(文本、表格、图表),系统评估了现有检索方法在语义理解、布局分析和多语言泛化上的能力,揭示了多模态大语言模型(MLLMs)在结构化内容和低资源语言上的性能瓶颈,为未来研究提供了标准化评估框架。


2️⃣ 论文创新点

1. 首个多语言多模态长文档检索基准

2. 细粒度评估与真实场景模拟

3. 多语言性能分析与新评估指标

4. 揭示MLLMs的局限性


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF