arXiv最新AI论文速览速学

🔍

theory ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 77 72小时内新更新论文 72h更新 177 最新: On the Expressive Power of GNNs to Solve Linear SDPs 05-03

arXiv ID: 2601.21487

arXiv 提交日期: 2026-01-29

machine learning model training theory optimization manifold constraints steepest descent riemannian gradient stiefel manifold

流形约束最速下降法 / Manifold constrained steepest descent

1️⃣ 一句话总结

这篇论文提出了一种名为MCSD的单循环优化框架，用于解决数据点位于特定几何结构（流形）上的机器学习问题，它通过巧妙结合线性优化和投影步骤，在保持理论收敛性的同时，比现有方法更稳定高效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21135

arXiv 提交日期: 2026-01-29

theory machine learning model training causal representation learning temporal modeling continuous mechanisms identifiability mixture of experts

TRACE：因果表征学习中连续机制演化的轨迹恢复 / TRACE: Trajectory Recovery for Continuous Mechanism Evolution in Causal Representation Learning

1️⃣ 一句话总结

这篇论文提出了一种名为TRACE的新方法，它能够从观测数据中识别出随时间平滑变化的因果机制（例如车辆转弯或人从走到跑的过渡），并精确恢复其演变轨迹，突破了现有方法只能处理突变机制的局限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22036

arXiv 提交日期: 2026-01-29

machine learning model evaluation theory representation learning distance metric domain shift geometric invariance generalization

交叉融合距离：一种衡量表征空间中数据组间融合与可分离性的新度量 / Cross-Fusion Distance: A Novel Metric for Measuring Fusion and Separability Between Data Groups in Representation Space

1️⃣ 一句话总结

这篇论文提出了一种名为‘交叉融合距离’的新度量方法，它能有效量化不同数据组在表征空间中的混合程度，专注于捕捉真正影响融合的几何变化，同时忽略无关的全局缩放等干扰，为评估表征学习效果提供了一个更可靠的理论工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21217

arXiv 提交日期: 2026-01-29

machine learning model training theory empirical bayes variational inference sparse logistic regression generalized linear models mean-field approximation

广义线性模型的灵活经验贝叶斯方法及其在稀疏逻辑回归中的应用 / A Flexible Empirical Bayes Approach to Generalized Linear Models, with Applications to Sparse Logistic Regression

1️⃣ 一句话总结

这篇论文提出了一种新的、无需手动调参的灵活经验贝叶斯方法，通过优化后验均值和先验参数来高效拟合广义线性模型，并在稀疏逻辑回归问题上展现出优越的预测性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21568

arXiv 提交日期: 2026-01-29

theory model evaluation machine learning representation similarity usable information mutual information stitching functional similarity

通过可用信息桥接功能相似性与表征相似性 / Bridging Functional and Representational Similarity via Usable Information

1️⃣ 一句话总结

这篇论文提出了一个基于‘可用信息’的统一框架，从理论和实证上阐明了神经网络表征之间功能相似性与表征相似性的关系，揭示了相似性评估依赖于观察者的能力，并且表征相似是功能相似的充分但不必要条件。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21780

arXiv 提交日期: 2026-01-29

theory machine learning model training quantum machine learning hybrid models modular architecture variational quantum circuits generalization theory

量子乐高学习：一种混合人工智能的模块化设计原则 / Quantum LEGO Learning: A Modular Design Principle for Hybrid Artificial Intelligence

1️⃣ 一句话总结

这篇论文提出了一种名为‘量子乐高学习’的模块化框架，它将经典神经网络和量子电路视为可自由组合的‘积木块’，从而更清晰、灵活地构建混合人工智能模型，并证明了在资源受限的情况下，量子模块能带来性能优势。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21367

arXiv 提交日期: 2026-01-29

machine learning model training theory hebbian learning biologically plausible backpropagation alternative global-local learning neural network training

具有全局指导的赫布学习 / Hebbian Learning with Global Direction

1️⃣ 一句话总结

本文提出了一种结合局部与全局信息的新型赫布学习框架，通过全局信号指导局部学习，使其能在大型网络和复杂任务上取得接近反向传播的性能，从而克服了传统赫布学习因缺乏全局目标而难以扩展的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21983

arXiv 提交日期: 2026-01-29

machine learning model training theory bayesian inference sequential monte carlo neural networks data annealing particle methods

在序列蒙特卡洛框架中研究神经网络的批次推断 / Investigating Batch Inference in a Sequential Monte Carlo Framework for Neural Networks

1️⃣ 一句话总结

这篇论文提出了一种改进的序列蒙特卡洛采样方法，通过逐步引入小批量数据来近似贝叶斯神经网络的后验分布，在图像分类基准测试中实现了高达6倍的训练加速，且精度损失极小。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.22141

arXiv 提交日期: 2026-01-29

model training machine learning theory neural network pruning lottery ticket hypothesis adaptive subnetworks data heterogeneity parameter efficiency

路由彩票：面向异构数据的自适应子网络 / Routing the Lottery: Adaptive Subnetworks for Heterogeneous Data

1️⃣ 一句话总结

这篇论文提出了一种名为‘路由彩票’的自适应剪枝框架，它能在大型神经网络中为不同类型的数据自动发现并分配专门的、参数更少的子网络，从而在保持高性能的同时，让模型结构更好地匹配现实世界数据的多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21653

arXiv 提交日期: 2026-01-29

machine learning theory model evaluation representation geometry feature curvature gauge invariance robustness geometric deep learning

规范不变的表征和乐 / Gauge-invariant representation holonomy

1️⃣ 一句话总结

这篇论文提出了一种名为‘表征和乐’的新方法，它通过测量神经网络内部特征在输入空间微小路径上的变化程度，来揭示传统相似性度量方法无法捕捉到的模型几何结构差异，并发现这种差异与模型的鲁棒性密切相关。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2601.21487

1️⃣ 一句话总结

arXiv ID: 2601.21135

1️⃣ 一句话总结

arXiv ID: 2601.22036

1️⃣ 一句话总结

arXiv ID: 2601.21217

1️⃣ 一句话总结

arXiv ID: 2601.21568

1️⃣ 一句话总结

arXiv ID: 2601.21780

1️⃣ 一句话总结

arXiv ID: 2601.21367

1️⃣ 一句话总结

arXiv ID: 2601.21983

1️⃣ 一句话总结

arXiv ID: 2601.22141

1️⃣ 一句话总结

arXiv ID: 2601.21653

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2601.21487 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21135 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22036 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21217 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21568 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21780 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21367 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21983 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.22141 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21653 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2601.21487

arXiv ID: 2601.21135

arXiv ID: 2601.22036

arXiv ID: 2601.21217

arXiv ID: 2601.21568

arXiv ID: 2601.21780

arXiv ID: 2601.21367

arXiv ID: 2601.21983

arXiv ID: 2601.22141

arXiv ID: 2601.21653