arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 167 最新: MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction 02-27

arXiv ID: 2602.04853

arXiv 提交日期: 2026-02-04

llm model evaluation natural language processing decomposed prompting uncertainty estimation closed-book qa hallucination detection abstention policy

分解式提示并不能弥补知识缺口，但能帮助模型说“我不知道” / Decomposed Prompting Does Not Fix Knowledge Gaps, But Helps Models Say "I Don't Know"

1️⃣ 一句话总结

这篇论文研究发现，通过比较大语言模型在直接、辅助和渐进式等不同分解提示策略下的回答差异，可以精准探测模型的内在不确定性，从而无需额外训练或检索就能有效让模型在闭卷问答中识别并承认自己不知道的问题，减少错误回答。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05026

arXiv 提交日期: 2026-02-04

theory model training machine learning learning dynamics entropy ensemble learning adversarial defense conservation laws

学习动力学的基本定律与学习者的核心 / Laws of Learning Dynamics and the Core of Learners

1️⃣ 一句话总结

这篇论文提出了支配学习过程的两条基本定律（守恒律和总熵减少律），并基于此开发了一种新的终身集成学习方法，该方法在防御对抗性攻击的测试中，比简单平均模型的方法表现更好，尤其在强干扰下优势明显。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04540

arXiv 提交日期: 2026-02-04

agents llm natural language processing personalized agents context-aware reasoning active learning persona modeling transparent ai

PersoPilot：一个结合角色理解与上下文分析的自适应AI副驾驶系统 / PersoPilot: An Adaptive AI-Copilot for Transparent Contextualized Persona Classification and Personalized Response Generation

1️⃣ 一句话总结

本文提出了PersoPilot，一个创新的自适应AI副驾驶框架，它通过将动态角色建模与实时上下文推理相结合，并集成分析师驱动的主动学习循环，为终端用户和分析师提供透明、可解释且持续优化的个性化服务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04864

arXiv 提交日期: 2026-02-04

llm multi-modal model training vision-language models token efficiency object representation adaptive inference mask-based features

当LLaVA遇见物体：视觉语言模型的令牌组合方法 / When LLaVA Meets Objects: Token Composition for Vision-Language-Models

1️⃣ 一句话总结

这篇论文提出了一种名为Mask-LLaVA的新方法，通过组合不同层级的视觉特征来大幅减少视觉语言模型所需的图像表示令牌数量，从而在保持性能的同时显著提升模型推理效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04118

arXiv 提交日期: 2026-02-04

llm model training theory parameter efficiency reinforcement learning reasoning low-rank adaptation model scaling

用13个参数学习推理 / Learning to Reason in 13 Parameters

1️⃣ 一句话总结

这篇论文提出了一种名为TinyLoRA的新方法，它通过强化学习，仅用少至13个可训练参数就能让大型语言模型学会复杂的数学推理，性能接近使用成千上万参数的传统方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04784

arXiv 提交日期: 2026-02-04

computer vision model training theory vision transformers attention mechanism information bottleneck mechanistic interpretability representation learning

从独立补丁到协调注意力：控制视觉Transformer中的信息流 / From independent patches to coordinated attention: Controlling information flow in vision transformers

1️⃣ 一句话总结

这篇论文通过在视觉Transformer的注意力机制中引入信息瓶颈，可以像调节旋钮一样控制模型内部的信息交流程度，从而让模型从‘各看各的’的局部处理平滑过渡到‘协同合作’的全局注意力，这有助于我们理解和分析模型内部的工作机制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04340

arXiv 提交日期: 2026-02-04

computer vision model training machine learning active learning vision-language models prompt tuning uncertainty estimation clip adaptation

基于双提示调优的主动CLIP自适应显式不确定性建模 / Explicit Uncertainty Modeling for Active CLIP Adaptation with Dual Prompt Tuning

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过在CLIP模型中引入一正一反两个可学习的文本提示，不仅提升了模型对特定图像分类任务的识别能力，还能直接估算预测结果的可靠性，从而在有限的标注预算下，更智能地选择最有价值的样本进行人工标注，显著提高了主动学习的效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04718

arXiv 提交日期: 2026-02-04

llm model training theory sparse autoencoder orthogonality regularization feature disentanglement causal intervention interpretability

通过正交正则化识别可干预与可解释的特征 / Identifying Intervenable and Interpretable Features via Orthogonality Regularization

1️⃣ 一句话总结

这篇论文提出了一种使用正交正则化的方法，在微调语言模型时让特征变得几乎正交，从而减少特征间的干扰，提升特征的可解释性和可干预性，同时保持模型性能基本不变。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04287

arXiv 提交日期: 2026-02-04

machine learning systems model training convolutional neural networks pde solving turbulence modeling inverse problems spatio-temporal prediction

用于正问题和反问题的卷积算子网络（FI-Conv）：在等离子体湍流模拟中的应用 / Convolution Operator Network for Forward and Inverse Problems (FI-Conv): Application to Plasma Turbulence Simulations

1️⃣ 一句话总结

这篇论文提出了一种名为FI-Conv的新型神经网络框架，它基于改进的U-Net结构，能够准确预测等离子体湍流等复杂时空系统的未来演化，并能从观测数据中反推出控制系统的物理参数。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04210

arXiv 提交日期: 2026-02-04

llm agents model training scalable oversight interactive feedback reinforcement learning human-ai collaboration intent decomposition

通过可扩展的交互式监督引导大型语言模型 / Steering LLMs via Scalable Interactive Oversight

1️⃣ 一句话总结

这篇论文提出了一个名为‘可扩展交互式监督’的新框架，它通过将复杂的任务意图分解成一棵可管理的决策树，并引导用户在每一步提供简单的反馈，从而让非专业人士也能有效引导AI完成超出其自身专业能力的复杂任务，并在网页开发任务中验证了其有效性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.04853

1️⃣ 一句话总结

arXiv ID: 2602.05026

1️⃣ 一句话总结

arXiv ID: 2602.04540

1️⃣ 一句话总结

arXiv ID: 2602.04864

1️⃣ 一句话总结

arXiv ID: 2602.04118

1️⃣ 一句话总结

arXiv ID: 2602.04784

1️⃣ 一句话总结

arXiv ID: 2602.04340

1️⃣ 一句话总结

arXiv ID: 2602.04718

1️⃣ 一句话总结

arXiv ID: 2602.04287

1️⃣ 一句话总结

arXiv ID: 2602.04210

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.04853 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05026 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04540 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04864 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04118 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04784 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04340 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04718 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04287 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04210 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.04853

arXiv ID: 2602.05026

arXiv ID: 2602.04540

arXiv ID: 2602.04864

arXiv ID: 2602.04118

arXiv ID: 2602.04784

arXiv ID: 2602.04340

arXiv ID: 2602.04718

arXiv ID: 2602.04287

arXiv ID: 2602.04210