arXiv最新AI论文速览速学

🔍

标签: #regularization ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Smoothness-Based Derandomization of PAC-Bayes Bounds 06-18

arXiv ID: 2606.19105

arXiv 提交日期: 2026-06-17

machine learning theory pac-bayes derandomization generalization bounds smoothness regularization

基于平滑性的PAC-Bayes界去随机化方法 / Smoothness-Based Derandomization of PAC-Bayes Bounds

1️⃣ 一句话总结

本文提出了一种利用损失函数和预测器平滑性将PAC-Bayes概率上界转化为确定性预测器高概率泛化界的方法，并通过引入基于参数雅可比矩阵和海森矩阵的正则化项来提升神经网络的实际泛化性能，实验表明该方法对批量归一化网络有效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28679

arXiv 提交日期: 2026-05-27

machine learning theory ridge regression regularization optimization generalization

最优岭回归正则化再探 / Optimal ridge regularization revisited

1️⃣ 一句话总结

本文提出了一种迭代算法，能够从数据生成参数中计算出岭回归的最优正则化强度，并在有限噪声下确保收敛，实验表明该算法结合样本估计可在不同样本量和噪声水平下达到接近最优的泛化性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.26670

arXiv 提交日期: 2026-05-26

llm model training model evaluation knowledge editing sequential editing regularization stability optimization analysis

迷宫与线：重新思考大型语言模型顺序知识编辑中的正则化机制 / The Labyrinth and the Thread: Rethinking Regularizations in Sequential Knowledge Editing for Large Language Models

1️⃣ 一句话总结

本文通过严格的数学分析发现，大型语言模型进行多次知识更新时，许多常用的复杂正则化技巧其实是不必要的，只要正确累积每次修改的约束条件就能自然保证更新稳定，从而为简化模型知识编辑提供了更清晰、可靠的指导。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21541

arXiv 提交日期: 2026-05-20

machine learning multi-modal adversarial attack transferability frequency domain multimodal llm regularization

面向闭源多模态大模型可迁移攻击的频域正则化对抗对齐方法 / Frequency-Domain Regularized Adversarial Alignment for Transferable Attacks against Closed-Source MLLMs

1️⃣ 一句话总结

本文提出一种名为FRA-Attack的攻击方法，通过在频域中对图像扰动进行双重正则化（高通滤波对齐视觉关注区域、低通滤波去除模型特有噪声），使得在开源模型上生成的攻击样本能更有效地欺骗GPT、Claude等闭源多模态大模型，并取得了当前最好的跨模型迁移攻击效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20994

arXiv 提交日期: 2026-05-20

llm machine learning safety alignment robustness preference optimization regularization evaluation

面向大型语言模型的上下文不变安全对齐 / Towards Context-Invariant Safety Alignment for Large Language Models

1️⃣ 一句话总结

本文提出一种名为锚定不变正则化（AIR）的方法，通过将可验证的提示作为锚点，仅优化开放变体的性能，从而让大语言模型在面对不同措辞时能基于真实意图一致地拒绝有害请求，显著提升了安全行为的鲁棒性和跨场景一致性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.19214

arXiv 提交日期: 2026-05-19

medical machine learning model evaluation medical image classification fairness equalized odds demographic disparity regularization

多属性公平医学图像分类的最差组均衡赔率正则化 / Worst-Group Equalized Odds Regularization for Multi-Attribute Fair Medical Image Classification

1️⃣ 一句话总结

本文提出了一种新的正则化方法，通过聚焦于不同人群（如年龄、性别、种族）中表现最差的子组，平衡其真假阳性率，从而在不过度降低整体诊断准确率的前提下，减少医学图像分类模型中由单一操作点引发的过度诊断或诊断不足等不公平问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.17795

arXiv 提交日期: 2026-05-18

machine learning model evaluation noisy label learning out-of-distribution detection uncertainty collapse benchmark regularization

当准确率不够时：噪声标签学习与分布外检测之间的不确定性崩塌 / When Accuracy Is Not Enough: Uncertainty Collapse between Noisy Label Learning and Out-of-Distribution Detection

1️⃣ 一句话总结

本文发现，在噪声标签学习任务中，高分类准确率并不能保证模型在检测分布外样本时的可靠性，因为被错误分类的低置信度样本与分布外样本在特征空间上会发生重叠，导致“不确定性崩塌”；作者提出了一个修复方法——虚拟边缘正则化，能在不牺牲准确率的前提下部分缓解这一问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.13833

arXiv 提交日期: 2026-04-15

llm model training model evaluation reward modeling causal decomposition alignment regularization robustness

通过因果分解实现大语言模型的稳健奖励建模 / Robust Reward Modeling for Large Language Models via Causal Decomposition

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过训练一个解码器来重构用户提问的潜在意图，并利用重构误差来指导奖励模型，从而有效减少奖励模型对答案长度、讨好语气等表面线索的依赖，使其更专注于理解用户真实意图，最终在多个任务上提升了模型的判断准确性和输出质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.25009

arXiv 提交日期: 2026-03-26

theory model training machine learning grokking generalization optimization regularization neural networks

关于神经网络“顿悟”现象的系统性实证研究：深度、架构、激活函数与正则化 / A Systematic Empirical Study of Grokking: Depth, Architecture, Activation, and Regularization

1️⃣ 一句话总结

这篇论文通过一系列精心控制的实验发现，神经网络训练中出现的‘顿悟’现象（即模型从死记硬背突然转变为真正理解规律）主要不是由网络架构决定的，而是由优化过程的稳定性和正则化强度之间的微妙互动共同主导的。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16568

arXiv 提交日期: 2026-03-17

machine learning model training theory autoencoders unsupervised learning manifold learning dimensionality reduction regularization

流形匹配自编码器 / Manifold-Matching Autoencoders

1️⃣ 一句话总结

这篇论文提出了一种名为流形匹配自编码器的简单无监督正则化方法，它通过让编码器在潜在空间中保持与原始输入数据相同的点间距离关系，来提升数据表示的保真度和可扩展性，效果优于同类方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.19105

1️⃣ 一句话总结

arXiv ID: 2605.28679

1️⃣ 一句话总结

arXiv ID: 2605.26670

1️⃣ 一句话总结

arXiv ID: 2605.21541

1️⃣ 一句话总结

arXiv ID: 2605.20994

1️⃣ 一句话总结

arXiv ID: 2605.19214

1️⃣ 一句话总结

arXiv ID: 2605.17795

1️⃣ 一句话总结

arXiv ID: 2604.13833

1️⃣ 一句话总结

arXiv ID: 2603.25009

1️⃣ 一句话总结

arXiv ID: 2603.16568

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.19105 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28679 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.26670 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21541 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20994 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.19214 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.17795 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.13833 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.25009 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16568 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.19105

arXiv ID: 2605.28679

arXiv ID: 2605.26670

arXiv ID: 2605.21541

arXiv ID: 2605.20994

arXiv ID: 2605.19214

arXiv ID: 2605.17795

arXiv ID: 2604.13833

arXiv ID: 2603.25009

arXiv ID: 2603.16568