arXiv ID:
2605.19344
检索增强的语言校准 / Retrieval-Augmented Linguistic Calibration
1️⃣ 一句话总结
本文提出了一种名为RALC的轻量级后处理方法,通过检索并改写文本中的语言信心表达,让AI模型在回答问题时能更准确、更可靠地反映其真实把握程度,从而提升信息传达的诚实度与可信度。
检索增强的语言校准 / Retrieval-Augmented Linguistic Calibration
本文提出了一种名为RALC的轻量级后处理方法,通过检索并改写文本中的语言信心表达,让AI模型在回答问题时能更准确、更可靠地反映其真实把握程度,从而提升信息传达的诚实度与可信度。
面向长期LLM人格一致性的异构时间记忆治理框架 / A Heterogeneous Temporal Memory Governance Framework for Long-Term LLM Persona Consistency
该论文提出了一种名为ARPM的外部时间记忆治理框架,通过将静态知识与动态对话经验分离存储,并融合检索、排序和证据验证机制,有效解决了大语言模型在长期对话中的事实丢失、时间线混乱和角色漂移问题,并通过实验证明了其比仅依赖模型权重或长上下文的方法更可追溯、可审计和可迁移。
M³-VQA:面向多模态、多实体、多跳视觉问答的基准数据集 / M$^3$-VQA: A Benchmark for Multimodal, Multi-Entity, Multi-Hop Visual Question Answering
该论文提出了一个名为M³-VQA的新型视觉问答基准,专门设计用于测试多模态大模型在同时处理多个实体、结合文本与图像信息,并进行多步推理方面的能力,实验发现现有模型在没有外部知识时表现很差,但提供精确证据后性能显著提升,同时结构化推理比简单搜索更有效。
MultiHedge:通过检索增强控制实现自适应协调 / MultiHedge: Adaptive Coordination via Retrieval-Augmented Control
本文提出了一种名为MultiHedge的混合系统,它让大型语言模型(LLM)通过检索历史成功案例来做出更稳健的决策,并结合经典金融策略执行,实验表明这种“记忆增强”的方法比单纯扩大模型规模更能提升系统在不确定环境下的稳定性和适应性。
基于检索增强的多模态虚假新闻检测模型 / Retrieval-Augmented Multimodal Model for Fake News Detection
本文提出了一种名为RAMM的检索增强多模态模型,通过引入叙事对齐模块和语义表示对齐模块,利用外部知识检索来捕捉跨实例的叙事一致性,从而提升了在跨领域和低资源场景下虚假新闻检测的准确性和泛化能力。
RASP-Tuner:用于非平稳环境中上下文感知黑盒优化的检索增强软提示方法 / RASP-Tuner: Retrieval-Augmented Soft Prompts for Context-Aware Black-Box Optimization in Non-Stationary Environments
这篇论文提出了一种名为RASP-Tuner的新方法,它通过检索历史相似场景并结合‘软提示’技术,来高效、低成本地优化那些会随时间或环境变化而改变目标的复杂系统。
学习检索可导航候选对象以实现高效视觉语言导航 / Learning to Retrieve Navigable Candidates for Efficient Vision-and-Language Navigation
这篇论文提出了一种检索增强框架,通过引入两层轻量级检索模块来为大语言模型导航提供任务先验并过滤无关选项,从而在不修改模型本身的情况下,显著提升了视觉语言导航任务的效率和稳定性。
请先 登录 后再提交论文