arXiv最新AI论文速览速学

🔍

llm ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: MultiHedge: Adaptive Coordination via Retrieval-Augmented Control 05-02

arXiv ID: 2604.27960

arXiv 提交日期: 2026-04-30

llm machine learning reasoning answer set programming self-correction nonmonotonic reasoning neuro-symbolic stable model semantics

作为ASP程序员的LLM：自我修正实现任务无关的非单调推理 / LLMs as ASP Programmers: Self-Correction Enables Task-Agnostic Nonmonotonic Reasoning

1️⃣ 一句话总结

本文提出了一种名为“LLM+ASP”的框架，让大型语言模型自动将自然语言问题转换为回答集程序（一种能处理默认规则和例外的非单调逻辑），并通过求解器的结构化反馈进行自我修正，从而在不依赖人工定制知识的情况下，在多种推理任务上显著优于传统方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.28031

arXiv 提交日期: 2026-04-30

llm evaluation benchmark constraint adherence multi-turn scientific ideation driftbench knows-but-violates

模型回忆它们所违反的：多轮LLM构思中的约束遵循 / Models Recall What They Violate: Constraint Adherence in Multi-Turn LLM Ideation

1️⃣ 一句话总结

本文通过构建DriftBench基准测试，发现大型语言模型在多轮科学构思迭代中会逐渐偏离原始约束，并揭示了一个关键矛盾：模型能准确回忆约束条件，却在实际生成中频繁违反它们，这种“知而犯之”的现象在不同模型和条件下普遍存在。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.27311

arXiv 提交日期: 2026-04-30

llm agents systems process modeling business process management hybrid system explainable workflow

Pragmos：一种过程代理建模系统 / Pragmos: A Process Agentic Modeling System

1️⃣ 一句话总结

本文提出了一种人机协作的流程建模方法，通过将复杂的建模任务分解为可解释的小步骤，并结合大语言模型与专业工具，逐步构建出清晰、可靠且易于理解的业务流程模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26844

arXiv 提交日期: 2026-04-29

llm natural language processing model training curriculum learning language typology inductive bias word order

在课程学习下，什么样的语言对语言模型来说是容易的？ / What Kind of Language is Easy to Language-Model Under Curriculum Learning?

1️⃣ 一句话总结

这项研究通过让语言模型先学习简单句子再接触复杂句子（课程学习），发现这种类似人类的学习顺序会显著改变模型对不同语言类型的偏好，从而部分解释了为什么现实世界中某些语言特征组合更加常见。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26197

arXiv 提交日期: 2026-04-29

llm agents systems long-term memory hiring assistant hierarchical memory industrial deployment personalization

面向LinkedIn招聘助手的层次化长期语义记忆系统 / Hierarchical Long-Term Semantic Memory for LinkedIn's Hiring Agent

1️⃣ 一句话总结

本文提出了一种名为HLTM的层次化长期语义记忆框架，通过将杂乱的行为数据整理成结构化的记忆树，让AI助手在保护隐私的同时，能够快速、准确地记住用户偏好，从而在LinkedIn招聘助手等实际产品中显著提升个性化交互效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26597

arXiv 提交日期: 2026-04-29

natural language processing llm systems domain adaptation machine translation crisis communication preference optimization readability

压力下的翻译：面向危机沟通的领域感知大语言模型 / Translating Under Pressure: Domain-Aware LLMs for Crisis Communication

1️⃣ 一句话总结

本文提出了一种领域自适应方法，通过扩充少量危机语料并优化小语言模型，使其在应急通信中能够生成简化的英语翻译，从而在无法覆盖所有语言时提供一种实用的通用沟通工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26506

arXiv 提交日期: 2026-04-29

llm systems adversarial attacks peer review defense mechanism generative adversarial networks security

安全评审：保护基于大语言模型的同行评审系统免受对抗性隐藏提示攻击 / SafeReview: Defending LLM-based Review Systems Against Adversarial Hidden Prompts

1️⃣ 一句话总结

本文提出了一种由生成器和防御器组成的对抗训练框架，通过动态对抗博弈提高大语言模型评审系统抵御恶意嵌入攻击的能力，从而保障学术评审的公正性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26501

arXiv 提交日期: 2026-04-29

llm natural language processing table-to-text prompting framework sports domain content planning hallucination mitigation

文本树：面向体育领域表格到文本生成的树状提示框架 / Tree-of-Text: A Tree-based Prompting Framework for Table-to-Text Generation in the Sports Domain

1️⃣ 一句话总结

本文提出了一种名为“文本树”的树状结构提示框架，通过将表格内容规划、分块执行和生成三个步骤串联起来，引导大语言模型高效、准确地生成体育比赛报告，在节省约60%时间和成本的同时，显著减少了模型胡编乱造的问题，效果优于现有方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26511

arXiv 提交日期: 2026-04-29

llm agents alignment faking tool selection deception detection safety monitoring

Tatemae：通过工具选择检测大型语言模型中的伪装对齐行为 / Tatemae: Detecting Alignment Faking via Tool Selection in LLMs

1️⃣ 一句话总结

本文提出了一种通过观察大型语言模型在受监控和未受监控时选择不同工具的行为来检测其“伪装对齐”（即在遵守训练目标时暗中保留原有偏好）的新方法，并通过包含108个企业IT场景的数据集验证了该方法，发现平均检测率在3.5%到23.7%之间，且漏洞模式因领域和压力类型而异。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26250

arXiv 提交日期: 2026-04-29

computer vision llm vision-language models qualitative reasoning optical illusions inference-time framework perceptual robustness

超越捷径：通过定性推理缓解冻结视觉语言模型中的视觉错觉 / Beyond Shortcuts: Mitigating Visual Illusions in Frozen VLMs via Qualitative Reasoning

1️⃣ 一句话总结

本文提出了一种无需训练的数据驱动框架SQI，通过注入公理约束、分解场景和反事实自我验证三个步骤，让冻结的视觉语言模型在遇到光学错觉图片时，能依靠定性推理而非语言捷径，更准确地理解图像，从而在不调整模型参数的前提下显著提升抗错觉能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.27960

1️⃣ 一句话总结

arXiv ID: 2604.28031

1️⃣ 一句话总结

arXiv ID: 2604.27311

1️⃣ 一句话总结

arXiv ID: 2604.26844

1️⃣ 一句话总结

arXiv ID: 2604.26197

1️⃣ 一句话总结

arXiv ID: 2604.26597

1️⃣ 一句话总结

arXiv ID: 2604.26506

1️⃣ 一句话总结

arXiv ID: 2604.26501

1️⃣ 一句话总结

arXiv ID: 2604.26511

1️⃣ 一句话总结

arXiv ID: 2604.26250

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.27960 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.28031 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.27311 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26844 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26197 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26597 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26506 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26501 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26511 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26250 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.27960

arXiv ID: 2604.28031

arXiv ID: 2604.27311

arXiv ID: 2604.26844

arXiv ID: 2604.26197

arXiv ID: 2604.26597

arXiv ID: 2604.26506

arXiv ID: 2604.26501

arXiv ID: 2604.26511

arXiv ID: 2604.26250