📄 论文总结
UniDoc-Bench:面向文档中心多模态检索增强生成的统一基准 / UNIDOC-BENCH: A Unified Benchmark for Document-Centric Multimodal RAG
1️⃣ 一句话总结
这篇论文提出了首个大规模、真实场景下的多模态检索增强生成基准UniDoc-Bench,通过整合文本、表格和图像信息构建了1600个问答对,实验证明融合多模态信息的系统优于单一模态方法,并为开发更鲁棒的文档处理系统提供了实用指导。
请先 登录 后再提交论文
UniDoc-Bench:面向文档中心多模态检索增强生成的统一基准 / UNIDOC-BENCH: A Unified Benchmark for Document-Centric Multimodal RAG
这篇论文提出了首个大规模、真实场景下的多模态检索增强生成基准UniDoc-Bench,通过整合文本、表格和图像信息构建了1600个问答对,实验证明融合多模态信息的系统优于单一模态方法,并为开发更鲁棒的文档处理系统提供了实用指导。
SearchInstruct:通过基于检索的指令数据集创建增强领域适应性 / SearchInstruct: Enhancing Domain Adaptation via Retrieval-Based Instruction Dataset Creation
这篇论文提出了一种名为SearchInstruct的创新方法,它利用少量人工问题和大型语言模型自动扩展问题,并结合检索相关领域资源来生成高质量指令数据集,从而有效提升大语言模型在特定领域的适应性和性能。
HANRAG:用于多跳问答的启发式精准抗噪声检索增强生成框架 / HANRAG: Heuristic Accurate Noise-resistant Retrieval-Augmented Generation for Multi-hop Question Answering
本文提出了一种名为HANRAG的新型智能框架,通过智能分解复杂问题并过滤无关信息,有效提升了多跳问答系统的准确性和抗干扰能力。
LongEmotion:衡量大语言模型在长上下文交互中的情感智能 / LongEmotion: Measuring Emotional Intelligence of Large Language Models in Long-Context Interaction
这篇论文提出了一个名为LongEmotion的基准测试,专门用于评估大语言模型在长文本交互中的情感智能表现,并通过引入检索增强生成和协作情感建模方法,有效提升了模型在真实复杂场景下的情感理解与表达能力。