arXiv最新AI论文速览速学

🔍

标签: #retrieval ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 94 72小时内新更新论文 72h更新 150 最新: IPO Finance Agent: Evaluation of LLM Financial Analysts beyond Finance Agent v2, with Automated Rubric Generation -- the Case of the SpaceX (SPCX) IPO 06-23

arXiv ID: 2606.23032

arXiv 提交日期: 2026-06-22

llm finance agents evaluation benchmark retrieval rubric generation ipo due diligence

IPO金融智能体：超越Finance Agent v2的LLM金融分析师评估——以SpaceX（SPCX）首次公开募股为例的自动评分标准生成 / IPO Finance Agent: Evaluation of LLM Financial Analysts beyond Finance Agent v2, with Automated Rubric Generation -- the Case of the SpaceX (SPCX) IPO

1️⃣ 一句话总结

本文提出了一个名为IPO Finance Agent的评估框架，专门用于测试大语言模型在首次公开募股（IPO）尽职调查任务上的表现，通过改进文档检索技术、构建包含1000道问题的数据集以及引入自动生成评分标准的流程，发现阿里云Qwen 3.7 Max模型以每次查询0.30美元的成本达到了79.4%的准确率，远超现有基准。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.22844

arXiv 提交日期: 2026-06-22

llm agents machine learning long-term memory context collapse retrieval evaluation memory systems

RaMem：面向长期智能体记忆的上下文重构框架 / RaMem: Contextual Reinstatement for Long-term Agentic Memory

1️⃣ 一句话总结

针对AI记忆系统中不同场景的记忆碎片因失去上下文而难以判断是否适用于当前问题（即“上下文崩塌”问题），该论文提出RaMem框架，通过将记忆与原始事件时间、参与者等关键条件绑定，并在检索时匹配合适的上下文，从而让AI更准确、可靠地利用过去的经验来辅助决策，实验证明该方法在多个基准测试中平均F1得分提升超过10%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.13177

arXiv 提交日期: 2026-06-11

llm agents systems memory management long-term interaction compression budgeted storage retrieval

MemRefine：基于大语言模型的长期智能体记忆压缩方法 / MemRefine: LLM-Guided Compression for Long-Term Agent Memory

1️⃣ 一句话总结

本文提出一种名为MemRefine的框架，利用大语言模型作为智能裁判，通过分析事实内容而非表面相似性，智能地合并或删除冗余的记忆条目，在固定存储预算下保留最有价值的信息，从而高效管理长期对话智能体的记忆。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.09331

arXiv 提交日期: 2026-06-08

multi-modal model training retrieval omni-modal retrieval embedding fusion projector drift decoupled training audio retrieval

Conan-embedding-v3：融合模态专用模型实现全模态嵌入 / Conan-embedding-v3: Fusing Modality-Specific Models for Omni-Modal Embedding

1️⃣ 一句话总结

本文提出一种名为Conan-embedding-v3的新框架，通过先独立训练处理不同数据类型（如文本、图像、视频、音频）的专用模型，再将它们的能力融合到一个统一模型中，并专门解决融合时音频模块性能下降的“投影漂移”问题，最终实现了支持文本、图像、视频、文档和音频等多种数据类型的统一检索系统。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.04604

arXiv 提交日期: 2026-06-03

computer vision multi-modal retrieval composed image retrieval attribute disentanglement prototype learning neighbor relations cross-modal fusion

COMBINER：基于属性邻居关系的组合图像检索 / COMBINER: Composed Image Retrieval Guided by Attribute-based Neighbor Relations

1️⃣ 一句话总结

本文提出了一种名为COMBINER的图像检索方法，通过将图像中的属性特征进行解耦和统一建模，能够区分那些看起来相似但属性不同的图像，从而更准确地根据用户的多模态描述（如文字+示例图）找到目标图片。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21261

arXiv 提交日期: 2026-05-20

multi-modal retrieval zero-shot composed image retrieval semantic transition llm collaboration set-to-set alignment

STiTch：面向零样本组合图像检索的无训练协作语义过渡与传输框架 / STiTch: Semantic Transition and Transportation in Collaboration for Training-Free Zero-Shot Composed Image Retrieval

1️⃣ 一句话总结

本文提出了一种无需训练的零样本组合图像检索方法，通过语义过渡向量精炼文本描述，并利用双向传输距离实现图文之间的细粒度对齐，有效解决了现有方法中文本描述不准确和检索匹配粗糙的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.10414

arXiv 提交日期: 2026-05-11

llm model evaluation positional encoding long-context attention mechanism retrieval

记住遗忘：门控自适应位置编码 / Remember to Forget: Gated Adaptive Positional Encoding

1️⃣ 一句话总结

针对大语言模型中旋转位置编码（RoPE）在长序列下性能退化的问题，本文提出一种轻量级的门控自适应位置编码（GAPE），通过在注意力计算中引入内容感知的门控机制，让模型自动抑制不相关长距离信息、保留关键远距离信息，从而在不牺牲局部精度的情况下显著提升长文本处理的鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.06285

arXiv 提交日期: 2026-05-07

llm retrieval natural language processing retrieval augmented generation latent reasoning inference latency dense retrieval end-to-end optimization

基于潜在推理与检索的高效智能体RAG框架 / LatentRAG: Latent Reasoning and Retrieval for Efficient Agentic RAG

1️⃣ 一句话总结

LatentRAG提出一种新方法，让AI模型在内部‘潜在空间’中完成思考和搜索，而不是逐字生成文字，从而在保持回答质量的同时将推理速度提升近10倍，解决了传统智能体RAG系统响应慢的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17898

arXiv 提交日期: 2026-04-20

multi-modal video retrieval composed video retrieval feature calibration directional bias semantic disentanglement evidence-driven alignment

ReTrack：基于证据驱动的双流方向锚定校准网络用于组合视频检索 / ReTrack: Evidence-Driven Dual-Stream Directional Anchor Calibration Network for Composed Video Retrieval

1️⃣ 一句话总结

本文提出了一种名为ReTrack的新型网络，通过校准视频和文本的组合特征方向偏差，有效解决了组合视频检索中信息密度不匹配导致的检索不准确问题，并在图像检索任务中同样表现出色。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.22241

arXiv 提交日期: 2026-03-23

natural language processing model training llm diffusion language models memory enhancement bi-level optimization inference adaptation retrieval

MemDLM：内存增强的扩散语言模型训练 / MemDLM: Memory-Enhanced DLM Training

1️⃣ 一句话总结

这篇论文提出了一种名为MemDLM的新方法，通过在训练中引入一个模拟的去噪过程来减少扩散语言模型训练与推理之间的不匹配，从而让模型学得更快、更好，并且在推理时能更好地处理长文本和检索任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.23032

1️⃣ 一句话总结

arXiv ID: 2606.22844

1️⃣ 一句话总结

arXiv ID: 2606.13177

1️⃣ 一句话总结

arXiv ID: 2606.09331

1️⃣ 一句话总结

arXiv ID: 2606.04604

1️⃣ 一句话总结

arXiv ID: 2605.21261

1️⃣ 一句话总结

arXiv ID: 2605.10414

1️⃣ 一句话总结

arXiv ID: 2605.06285

1️⃣ 一句话总结

arXiv ID: 2604.17898

1️⃣ 一句话总结

arXiv ID: 2603.22241

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.23032 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.22844 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.13177 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.09331 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.04604 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21261 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.10414 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.06285 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17898 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.22241 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.23032

arXiv ID: 2606.22844

arXiv ID: 2606.13177

arXiv ID: 2606.09331

arXiv ID: 2606.04604

arXiv ID: 2605.21261

arXiv ID: 2605.10414

arXiv ID: 2605.06285

arXiv ID: 2604.17898

arXiv ID: 2603.22241