arXiv最新AI论文速览速学

🔍

标签: #theoretical analysis ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Understanding Truncated Positional Encodings for Graph Neural Networks 06-12

arXiv ID: 2606.13671

arXiv 提交日期: 2026-06-11

machine learning theory graph neural networks positional encodings expressive power truncation theoretical analysis

理解图神经网络的截断位置编码 / Understanding Truncated Positional Encodings for Graph Neural Networks

1️⃣ 一句话总结

本文研究了图神经网络中常用的两类位置编码（基于图谱和基于随机游走）在截断使用时的表达能力差异，发现截断后它们不再等价，且传统上更强大的谱编码甚至可能弱于最简单的图同构检测器1-WL，实验表明混合使用不同截断编码效果更优。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.01424

arXiv 提交日期: 2026-05-02

machine learning multi-modal generalization bounds metric learning modality selection theoretical analysis pairwise complexity

量化多模态能力：成对度量学习中的形式化泛化保证 / Quantifying Multimodal Capabilities: Formal Generalization Guarantees in Pairwise Metric Learning

1️⃣ 一句话总结

该论文通过数学分析，揭示了在多模态学习中，如何选择不同种类的数据（如图像、文本）会显著影响模型的学习效果，并首次给出了量化的理论保证，证明使用更精细的模态数据能减少模型出错的可能性，从而提升学习速度和准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19724

arXiv 提交日期: 2026-04-21

computer vision theory machine learning vision transformers adversarial training benign overfitting robust generalization theoretical analysis

对抗训练中视觉Transformer的良性过拟合 / Benign Overfitting in Adversarial Training for Vision Transformers

1️⃣ 一句话总结

本文首次从理论上证明了，在特定信号噪声比和适度扰动强度下，视觉Transformer（ViT）通过对抗训练不仅能实现近乎零的鲁棒训练损失和良好的泛化能力，而且即使模型出现过度拟合，这种过拟合反而是“良性”的——不会损害模型对对抗样本的防御效果，从而将之前仅在卷积神经网络（CNN）中观察到的现象推广到了ViT中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15923

arXiv 提交日期: 2026-03-16

llm theory model training transformers memory retrieval gradient descent theoretical analysis capacity scaling

超越正交嵌入：基于Transformer的记忆学习研究 / Learning to Recall with Transformers Beyond Orthogonal Embeddings

1️⃣ 一句话总结

这篇论文通过分析在非正交随机嵌入下训练的简单Transformer模型，揭示了其记忆能力（即存储和检索信息的能力）取决于样本数量、嵌入维度和序列长度三者的乘积关系，并证明这种关系是此类模型在现实有限数据场景下的固有特性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21765

arXiv 提交日期: 2026-02-25

theory llm model training reinforcement learning from human feedback generalization theory reward shift kl regularization theoretical analysis

奖励偏移与截断KL正则化下RLHF的泛化理论 / Generalisation of RLHF under Reward Shift and Clipped KL Regularisation

1️⃣ 一句话总结

这篇论文为基于人类反馈的强化学习（RLHF）建立了一套泛化理论，首次系统分析了因奖励模型训练数据与当前策略不匹配导致的‘奖励偏移’问题，以及因技术实现而引入的‘KL正则项截断误差’，并据此为实际训练中的参数设置和数据分配提供了理论指导。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16601

arXiv 提交日期: 2026-02-18

model training theory machine learning diffusion models error propagation model collapse synthetic data theoretical analysis

扩散模型中的误差传播与模型崩溃：一项理论研究 / Error Propagation and Model Collapse in Diffusion Models: A Theoretical Study

1️⃣ 一句话总结

这篇论文从理论上分析了扩散模型在反复使用自身生成的合成数据进行训练时，其生成质量会如何因误差累积而逐渐恶化，并揭示了这种‘模型崩溃’现象在不同训练数据配比下的变化规律。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05713

arXiv 提交日期: 2026-02-05

machine learning theory model training fairness boosting theoretical analysis distribution projection accuracy-fairness tradeoff

带公平性约束的投影提升：量化公平训练分布的成本 / Projected Boosting with Fairness Constraints: Quantifying the Cost of Fair Training Distributions

1️⃣ 一句话总结

这篇论文提出了一种名为FairBoost的新方法，它在保持提升算法理论分析能力的同时，通过将训练分布投影到满足公平性约束的集合上，来量化并控制追求公平性所导致的模型准确率下降成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04233

arXiv 提交日期: 2026-02-04

machine learning model training theory pre-trained models sample complexity scaling laws theoretical analysis fine-tuning

预训练模型规模扩展可证明降低下游任务样本复杂度 / Provable Target Sample Complexity Improvements as Pre-Trained Models Scale

1️⃣ 一句话总结

这篇论文通过一个名为‘填隙’的新理论框架，首次从理论上证明了更大的预训练模型确实能降低下游任务的学习所需数据量，为实践中观察到的‘模型越大，下游性能越好’的规律提供了坚实的数学解释。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03655

arXiv 提交日期: 2026-02-03

theory model training machine learning group theory sequence learning network depth representation learning theoretical analysis

序列群组合：窥探深度学习机制的一扇窗 / Sequential Group Composition: A Window into the Mechanics of Deep Learning

1️⃣ 一句话总结

这篇论文通过设计一个名为‘序列群组合’的数学任务，揭示了不同深度神经网络（如浅层网络、循环网络和多层网络）在处理序列数据时，如何利用群的结构和运算的关联性来高效学习，从而为理解深度学习的内部工作机制提供了一个可分析的理论模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.04217

arXiv 提交日期: 2025-11-06

theory model training machine learning lottery ticket hypothesis attention mechanisms transformer theory neural network pruning theoretical analysis

多头注意力机制的强彩票假说 / The Strong Lottery Ticket Hypothesis for Multi-Head Attention Mechanisms

1️⃣ 一句话总结

这篇论文证明了在随机初始化的多头注意力网络和Transformer中，无需训练即可找到性能优秀的子网络，从而近似实现任意目标网络的功能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.13671

1️⃣ 一句话总结

arXiv ID: 2605.01424

1️⃣ 一句话总结

arXiv ID: 2604.19724

1️⃣ 一句话总结

arXiv ID: 2603.15923

1️⃣ 一句话总结

arXiv ID: 2602.21765

1️⃣ 一句话总结

arXiv ID: 2602.16601

1️⃣ 一句话总结

arXiv ID: 2602.05713

1️⃣ 一句话总结

arXiv ID: 2602.04233

1️⃣ 一句话总结

arXiv ID: 2602.03655

1️⃣ 一句话总结

arXiv ID: 2511.04217

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.13671 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.01424 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19724 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15923 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21765 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16601 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05713 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04233 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03655 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.04217 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.13671

arXiv ID: 2605.01424

arXiv ID: 2604.19724

arXiv ID: 2603.15923

arXiv ID: 2602.21765

arXiv ID: 2602.16601

arXiv ID: 2602.05713

arXiv ID: 2602.04233

arXiv ID: 2602.03655

arXiv ID: 2511.04217