arXiv最新AI论文速览速学

🔍

标签: #iterative refinement ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: MARDoc: A Memory-Aware Refinement Agent Framework for Multimodal Long Document QA 06-06

arXiv ID: 2606.05749

arXiv 提交日期: 2026-06-04

multi-modal agents llm document qa multimodal retrieval memory-augmented multi-hop reasoning iterative refinement

MARDoc：面向多模态长文档问答的忆感知精炼智能体框架 / MARDoc: A Memory-Aware Refinement Agent Framework for Multimodal Long Document QA

1️⃣ 一句话总结

本文提出了一种名为MARDoc的多智能体框架，通过将文档问答任务分解为检索、精炼和反思三个专业化角色，并利用结构化记忆代替杂乱的历史记录，有效解决了长文档中证据分散、推理易受干扰的问题，从而显著提升了复杂多步问答的准确性和可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.27245

arXiv 提交日期: 2026-05-26

machine learning theory symbolic regression iterative refinement latent space amortized inference complexity

通过潜在迭代精化实现符号回归 / Symbolic Regression via Latent Iterative Refinement

1️⃣ 一句话总结

本文提出了一种名为潜在方程嵌入（LEE）的神经符号回归方法，通过在一个功能驱动的潜在空间中进行迭代推理和混合梯度优化，相比现有方法，能以显著更简洁的数学表达式（复杂度低至8-11，而其他方法为20-90）达到同等或更优的拟合精度，并且在数据噪声增加时表现更稳健。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.25737

arXiv 提交日期: 2026-04-28

llm agents natural language processing multi-agent code editing benchmark hallucination reduction iterative refinement

SAFEdit：多智能体分解能否解决指令式代码编辑的可靠性挑战？ / SAFEdit: Does Multi-Agent Decomposition Resolve the Reliability Challenges of Instructed Code Editing?

1️⃣ 一句话总结

本研究提出SAFEdit，一个由规划、编辑和验证三个专门智能体协作的多智能体框架，通过将代码编辑任务分解为不同角色并引入结构化错误诊断机制，显著提升了指令式代码编辑的可靠性，在EditBench基准上将成功率从低于60%提升至68.6%，并有效减少了代码编辑中的指令幻觉问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.23989

arXiv 提交日期: 2026-04-27

llm model evaluation code generation multi-turn correction iterative refinement inference scaling safety analysis

固定初始代码并迭代优化文本方向以实现安全的多轮代码修正 / Fix Initial Codes and Iteratively Refine Textual Directions Toward Safe Multi-Turn Code Correction

1️⃣ 一句话总结

本文提出了一种名为IRTD的简单方法，通过固定初始代码并反复优化文本提示来逐步修正代码错误，无需复杂的搜索结构，就能达到与最先进方法相当的推理性能，并且理论上能保证修正过程的安全性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.13019

arXiv 提交日期: 2026-04-14

agents computer vision systems gui grounding visual feedback iterative refinement cursor localization coding environments

看、指、精调：基于视觉反馈的多轮图形用户界面定位方法 / See, Point, Refine: Multi-Turn Approach to GUI Grounding with Visual Feedback

1️⃣ 一句话总结

这篇论文提出了一种让AI助手在复杂编程界面中更精准点击目标的新方法，它通过‘观察-点击-根据视觉反馈调整’的多轮循环来逐步修正误差，而不是一次性猜测位置，从而显著提升了在密集代码编辑器等环境中的操作成功率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.11025

arXiv 提交日期: 2026-04-13

multi-modal llm model evaluation multimodal reasoning test-time scaling perceptual uncertainty visual grounding iterative refinement

测试时感知扩展：解决“图像思维”中的定位悖论 / Test-time Scaling over Perception: Resolving the Grounding Paradox in Thinking with Images

1️⃣ 一句话总结

这篇论文提出了一种名为TTSP的新方法，通过让AI模型在推理时像人类一样“多角度观察、筛选信息、整合知识并聚焦疑点”，有效解决了现有多模态模型在需要精细视觉推理时面临的“先看哪里”的决策困境，从而显著提升了其理解和分析复杂图像的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.07900

arXiv 提交日期: 2026-04-09

agents reinforcement learning computer vision anomaly synthesis industrial anomaly detection tool-augmented agents self-reflection iterative refinement

AnomalyAgent：基于工具增强强化学习的智能工业异常合成 / AnomalyAgent: Agentic Industrial Anomaly Synthesis via Tool-Augmented Reinforcement Learning

1️⃣ 一句话总结

这篇论文提出了一个名为AnomalyAgent的智能体，它通过集成多种工具和强化学习，能够像人类一样反思、检索知识和迭代优化，从而自动生成逼真且多样的工业异常图像，有效解决了异常检测任务中数据稀缺的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.25681

arXiv 提交日期: 2026-03-26

llm model training systems self-improvement autonomous learning closed-loop systems data generation iterative refinement

大语言模型的自我改进：技术概览与未来展望 / Self-Improvement of Large Language Models: A Technical Overview and Future Outlook

1️⃣ 一句话总结

这篇论文提出了一个让大语言模型自己生成数据、评估结果并不断优化自己的系统性框架，旨在解决人工监督成本高、难以持续提升模型能力的难题，并展望了未来实现完全自主改进的研究方向。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.21943

arXiv 提交日期: 2026-03-23

computer vision systems model evaluation geolocalization cross-view iterative refinement real-time satellite imagery

GeoFlow：通过迭代流预测实现实时细粒度跨视角地理定位 / GeoFlow: Real-Time Fine-Grained Cross-View Geolocalization via Iterative Flow Prediction

1️⃣ 一句话总结

这篇论文提出了一种名为GeoFlow的轻量高效新方法，它通过预测位置偏移和迭代优化多个假设，在保持高精度的同时实现了实时地理定位，打破了现有方法在精度与速度之间的两难权衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.18544

arXiv 提交日期: 2026-03-19

computer vision medical model training interactive segmentation surgical scene scribble prompting sam adaptation iterative refinement

SCISSR：基于涂鸦交互的手术场景分割与优化框架 / SCISSR: Scribble-Conditioned Interactive Surgical Segmentation and Refinement

1️⃣ 一句话总结

这篇论文提出了一种名为SCISSR的交互式手术图像分割方法，它允许用户通过简单的涂鸦来快速、精确地分割手术中形状不规则的组织和器械，并能在出错区域进行多次涂鸦修正，从而在保持模型通用性的同时显著提升了分割精度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.05749

1️⃣ 一句话总结

arXiv ID: 2605.27245

1️⃣ 一句话总结

arXiv ID: 2604.25737

1️⃣ 一句话总结

arXiv ID: 2604.23989

1️⃣ 一句话总结

arXiv ID: 2604.13019

1️⃣ 一句话总结

arXiv ID: 2604.11025

1️⃣ 一句话总结

arXiv ID: 2604.07900

1️⃣ 一句话总结

arXiv ID: 2603.25681

1️⃣ 一句话总结

arXiv ID: 2603.21943

1️⃣ 一句话总结

arXiv ID: 2603.18544

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.05749 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.27245 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.25737 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.23989 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.13019 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.11025 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.07900 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.25681 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.21943 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.18544 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.05749

arXiv ID: 2605.27245

arXiv ID: 2604.25737

arXiv ID: 2604.23989

arXiv ID: 2604.13019

arXiv ID: 2604.11025

arXiv ID: 2604.07900

arXiv ID: 2603.25681

arXiv ID: 2603.21943

arXiv ID: 2603.18544