arXiv ID:
2603.10442
广义高斯混合过程 / GGMPs: Generalized Gaussian Mixture Processes
1️⃣ 一句话总结
这篇论文提出了一种名为GGMP的新方法,它基于高斯过程,能够有效预测具有多个峰值、不确定性变化和非高斯特征的复杂数据分布,解决了传统方法只能预测单一、简单分布的局限性。
广义高斯混合过程 / GGMPs: Generalized Gaussian Mixture Processes
这篇论文提出了一种名为GGMP的新方法,它基于高斯过程,能够有效预测具有多个峰值、不确定性变化和非高斯特征的复杂数据分布,解决了传统方法只能预测单一、简单分布的局限性。
矩阵算子范数下神经优化器的宽度缩放研究 I:行/列归一化与超参数迁移 / On the Width Scaling of Neural Optimizers Under Matrix Operator Norms I: Row/Column Normalization and Hyperparameter Transfer
本文通过将AdamW等常用优化器解释为特定矩阵范数下的最速下降法,提出了一种基于行或列归一化的新优化器设计方法,能够在神经网络宽度增加时保持训练稳定性,并实现超参数在不同宽度模型间的有效迁移。
通过离散时间特征实现全局普适性 / Global universality via discrete-time signatures
这篇论文证明了,对于分段线性路径,其路径特征(signature)的线性泛函在满足一定可积条件下,能够以高精度逼近一大类路径相关的函数和方程,包括布朗运动驱动的随机微分方程,从而为复杂路径数据的建模和分析提供了一个强大的通用逼近工具。
移除触发器而非后门:替代触发器与潜在后门 / Removing the Trigger, Not the Backdoor: Alternative Triggers and Latent Backdoors
这篇论文挑战了传统观点,指出仅移除已知的后门触发器无法真正消除AI模型中的后门,因为存在多种感知上不同的替代触发器也能激活同一个后门,因此防御措施应针对特征空间中的后门方向,而非仅仅处理输入层面的触发器。
神经振荡器的泛化上界 / Upper Generalization Bounds for Neural Oscillators
这篇论文从理论上证明了,一种基于二阶微分方程构建的‘神经振荡器’模型,其预测误差会随着模型规模和任务时长缓慢增长,从而避免了参数过多带来的‘维数灾难’,并且通过限制模型复杂度可以有效提升其在小样本数据下的泛化能力。
TA-GGAD:用于通用图异常检测的测试时自适应图模型 / TA-GGAD: Testing-time Adaptive Graph Model for Generalist Graph Anomaly Detection
这篇论文提出了一种新的图异常检测通用模型,它通过分析和解决跨域数据中的‘异常非匹配性’问题,仅需一次训练就能有效识别多种不同图数据中的异常节点,并在多个真实数据集上取得了领先的检测精度。
面向视觉任务的旋转等变Mamba模型 / Rotation Equivariant Mamba for Vision Tasks
本文提出了首个具有旋转等变性的视觉Mamba架构EQ-VMamba,通过在模型中嵌入图像旋转对称性这一几何先验,使其对图像旋转更加鲁棒,并在多个视觉任务上以更少的参数取得了优异或具有竞争力的性能。
可微随机交通动力学:交通领域中的物理信息生成建模 / Differentiable Stochastic Traffic Dynamics: Physics-Informed Generative Modelling in Transportation
这篇论文提出了一种新的物理信息生成建模框架,将交通流的随机性直接融入深度学习模型,从而能够预测交通密度的概率分布,而不仅仅是单一数值,为交通状态估计和风险评估提供了更可靠的工具。
无遗忘路由 / Routing without Forgetting
这篇论文提出了一种名为‘无遗忘路由’的新方法,通过在Transformer模型中引入基于能量的联想检索层,让模型能够在只看到一次数据的情况下,动态地为每个输入选择最合适的处理路径,从而有效解决了在线持续学习中的灾难性遗忘问题。
用于卫星电子设备在线可靠性预测的自适应主动学习方法 / Adaptive Active Learning for Online Reliability Prediction of Satellite Electronics
本文提出了一种结合了新型退化模型与自适应采样策略的在线预测框架,能够在数据有限的情况下,显著提高卫星电子设备在轨可靠性的预测精度并降低数据需求。
请先 登录 后再提交论文