arXiv ID:
2601.21487
流形约束最速下降法 / Manifold constrained steepest descent
1️⃣ 一句话总结
这篇论文提出了一种名为MCSD的单循环优化框架,用于解决数据点位于特定几何结构(流形)上的机器学习问题,它通过巧妙结合线性优化和投影步骤,在保持理论收敛性的同时,比现有方法更稳定高效。
流形约束最速下降法 / Manifold constrained steepest descent
这篇论文提出了一种名为MCSD的单循环优化框架,用于解决数据点位于特定几何结构(流形)上的机器学习问题,它通过巧妙结合线性优化和投影步骤,在保持理论收敛性的同时,比现有方法更稳定高效。
TRACE:因果表征学习中连续机制演化的轨迹恢复 / TRACE: Trajectory Recovery for Continuous Mechanism Evolution in Causal Representation Learning
这篇论文提出了一种名为TRACE的新方法,它能够从观测数据中识别出随时间平滑变化的因果机制(例如车辆转弯或人从走到跑的过渡),并精确恢复其演变轨迹,突破了现有方法只能处理突变机制的局限。
交叉融合距离:一种衡量表征空间中数据组间融合与可分离性的新度量 / Cross-Fusion Distance: A Novel Metric for Measuring Fusion and Separability Between Data Groups in Representation Space
这篇论文提出了一种名为‘交叉融合距离’的新度量方法,它能有效量化不同数据组在表征空间中的混合程度,专注于捕捉真正影响融合的几何变化,同时忽略无关的全局缩放等干扰,为评估表征学习效果提供了一个更可靠的理论工具。
广义线性模型的灵活经验贝叶斯方法及其在稀疏逻辑回归中的应用 / A Flexible Empirical Bayes Approach to Generalized Linear Models, with Applications to Sparse Logistic Regression
这篇论文提出了一种新的、无需手动调参的灵活经验贝叶斯方法,通过优化后验均值和先验参数来高效拟合广义线性模型,并在稀疏逻辑回归问题上展现出优越的预测性能。
通过可用信息桥接功能相似性与表征相似性 / Bridging Functional and Representational Similarity via Usable Information
这篇论文提出了一个基于‘可用信息’的统一框架,从理论和实证上阐明了神经网络表征之间功能相似性与表征相似性的关系,揭示了相似性评估依赖于观察者的能力,并且表征相似是功能相似的充分但不必要条件。
量子乐高学习:一种混合人工智能的模块化设计原则 / Quantum LEGO Learning: A Modular Design Principle for Hybrid Artificial Intelligence
这篇论文提出了一种名为‘量子乐高学习’的模块化框架,它将经典神经网络和量子电路视为可自由组合的‘积木块’,从而更清晰、灵活地构建混合人工智能模型,并证明了在资源受限的情况下,量子模块能带来性能优势。
具有全局指导的赫布学习 / Hebbian Learning with Global Direction
本文提出了一种结合局部与全局信息的新型赫布学习框架,通过全局信号指导局部学习,使其能在大型网络和复杂任务上取得接近反向传播的性能,从而克服了传统赫布学习因缺乏全局目标而难以扩展的局限性。
在序列蒙特卡洛框架中研究神经网络的批次推断 / Investigating Batch Inference in a Sequential Monte Carlo Framework for Neural Networks
这篇论文提出了一种改进的序列蒙特卡洛采样方法,通过逐步引入小批量数据来近似贝叶斯神经网络的后验分布,在图像分类基准测试中实现了高达6倍的训练加速,且精度损失极小。
路由彩票:面向异构数据的自适应子网络 / Routing the Lottery: Adaptive Subnetworks for Heterogeneous Data
这篇论文提出了一种名为‘路由彩票’的自适应剪枝框架,它能在大型神经网络中为不同类型的数据自动发现并分配专门的、参数更少的子网络,从而在保持高性能的同时,让模型结构更好地匹配现实世界数据的多样性。
规范不变的表征和乐 / Gauge-invariant representation holonomy
这篇论文提出了一种名为‘表征和乐’的新方法,它通过测量神经网络内部特征在输入空间微小路径上的变化程度,来揭示传统相似性度量方法无法捕捉到的模型几何结构差异,并发现这种差异与模型的鲁棒性密切相关。
请先 登录 后再提交论文