arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 167 最新: MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction 02-27

arXiv ID: 2602.04431

arXiv 提交日期: 2026-02-04

agents systems theory multi-agent safety stackelberg game adversarial robustness llm-based search system design

MaMa：一种用于设计安全智能体系统的博弈论方法 / MaMa: A Game-Theoretic Approach for Designing Safe Agentic Systems

1️⃣ 一句话总结

这篇论文提出了一种名为MaMa的博弈论算法，通过让系统设计者与一个模拟的‘元对手’进行对抗性博弈，自动设计出即使在部分智能体被恶意控制时也能保持安全的多智能体系统。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04693

arXiv 提交日期: 2026-02-04

llm natural language processing systems intent classification political incivility linguistic graph prompt optimization rag

LinGO：一个利用大语言模型解释在线不文明言论意图的语言图优化框架 / LinGO: A Linguistic Graph Optimization Framework with LLMs for Interpreting Intents of Online Uncivil Discourse

1️⃣ 一句话总结

这篇论文提出了一个名为LinGO的框架，它通过将语言分解为多步骤的组成部分并针对易错环节进行优化，有效提升了大语言模型在识别在线不文明言论背后真实意图（如仇恨言论、暴力威胁等）时的准确性，解决了现有分类器容易误判的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04304

arXiv 提交日期: 2026-02-04

multi-modal model evaluation natural language processing vision-language models visual grounding attention mechanisms vqa dynamic inference

超越静态裁剪：面向复杂推理任务的层自适应视觉定位与解码增强 / Beyond Static Cropping: Layer-Adaptive Visual Localization and Decoding Enhancement

1️⃣ 一句话总结

这篇论文发现，大视觉语言模型在不同任务中依赖不同网络层进行视觉定位，并据此提出了一种无需训练、能自适应选择关键视觉信息层以提升复杂视觉问答准确性的新方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04881

arXiv 提交日期: 2026-02-04

machine learning systems model training contrastive learning continual learning internet of things federated learning tinyml

对比持续学习在物联网中的模型适应性研究 / Contrastive Continual Learning for Model Adaptability in Internet of Things

1️⃣ 一句话总结

这篇论文探讨了如何将对比学习与持续学习相结合，帮助物联网设备上的AI模型在不断变化的真实环境中持续学习新知识而不遗忘旧技能，同时兼顾了设备计算能力弱、网络不稳定和隐私保护等实际限制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04297

arXiv 提交日期: 2026-02-04

llm natural language processing model evaluation prompt sensitivity prompt engineering text classification zero-shot learning model robustness

重新审视大语言模型在文本分类中的提示敏感性：论提示未充分指定的作用 / Revisiting Prompt Sensitivity in Large Language Models for Text Classification: The Role of Prompt Underspecification

1️⃣ 一句话总结

这篇论文研究发现，大语言模型在文本分类任务中对提示语的敏感性问题，很大程度上是由于提示语本身定义不明确、指令不具体造成的，而提供清晰、具体的指令可以显著降低这种敏感性并提升模型性能的稳定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04360

arXiv 提交日期: 2026-02-04

machine learning model evaluation theory hypergraph neural networks explainable ai counterfactual explanations graph neural networks model interpretability

超图神经网络的因果解释方法 / Counterfactual Explanations for Hypergraph Neural Networks

1️⃣ 一句话总结

本文提出了一种名为CF-HyperGNNExplainer的新方法，通过找出并修改超图中最关键的节点或连接关系，来解释超图神经网络的决策原因，使其在关键领域的应用更透明可信。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04863

arXiv 提交日期: 2026-02-04

llm model training data dataset effects log-linear structure hidden subtext preference elicitation subliminal signals

数据中的潜意识效应：一种通过对数线性实现的通用机制 / Subliminal Effects in Your Data: A General Mechanism via Log-Linearity

1️⃣ 一句话总结

这篇论文发现了一种通用机制，通过有选择地组合训练数据中的子集，可以在大语言模型中引发各种隐藏的、非直观的行为模式，例如特定偏好、跨语言响应或不同角色扮演，且该效应在不同模型架构中普遍存在。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04548

arXiv 提交日期: 2026-02-04

theory model training machine learning gradient flow scaling regimes tensor decomposition explicit solutions diagram expansion

通过图展开的梯度流：学习机制与显式解 / Gradient Flow Through Diagram Expansions: Learning Regimes and Explicit Solutions

1️⃣ 一句话总结

这篇论文建立了一个用类似费曼图的展开方法来分析大规模机器学习中梯度流行为的数学框架，揭示了不同参数设置下模型的学习阶段，并能为某些非线性问题提供显式解。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04224

arXiv 提交日期: 2026-02-04

llm agents model training preference optimization safe reasoning jailbreak attacks risk-aware alignment chain-of-thought

RAPO：面向可泛化安全推理的风险感知偏好优化 / RAPO: Risk-Aware Preference Optimization for Generalizable Safe Reasoning

1️⃣ 一句话总结

本文提出了一种名为RAPO的风险感知优化框架，通过让大型推理模型在思考过程中动态识别并应对不同级别的安全风险，有效提升了模型抵御各种复杂诱导攻击的能力，同时保持了其通用任务性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04380

arXiv 提交日期: 2026-02-04

llm model training theory policy optimization bregman divergence reasoning mirror descent regularization

超越KL散度：利用灵活的布雷格曼散度进行大语言模型推理的策略优化 / Beyond KL Divergence: Policy Optimization with Flexible Bregman Divergences for LLM Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为GBMPO的新框架，通过引入更灵活的布雷格曼散度（如概率空间的L2距离或可学习的神经网络映射）来代替传统的KL散度进行策略正则化，从而显著提升了大语言模型在数学推理和代码生成任务上的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.04431

1️⃣ 一句话总结

arXiv ID: 2602.04693

1️⃣ 一句话总结

arXiv ID: 2602.04304

1️⃣ 一句话总结

arXiv ID: 2602.04881

1️⃣ 一句话总结

arXiv ID: 2602.04297

1️⃣ 一句话总结

arXiv ID: 2602.04360

1️⃣ 一句话总结

arXiv ID: 2602.04863

1️⃣ 一句话总结

arXiv ID: 2602.04548

1️⃣ 一句话总结

arXiv ID: 2602.04224

1️⃣ 一句话总结

arXiv ID: 2602.04380

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.04431 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04693 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04304 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04881 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04297 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04360 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04863 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04548 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04224 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04380 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.04431

arXiv ID: 2602.04693

arXiv ID: 2602.04304

arXiv ID: 2602.04881

arXiv ID: 2602.04297

arXiv ID: 2602.04360

arXiv ID: 2602.04863

arXiv ID: 2602.04548

arXiv ID: 2602.04224

arXiv ID: 2602.04380