arXiv ID:
2602.08243
离散伴随薛定谔桥采样器 / Discrete Adjoint Schrödinger Bridge Sampler
1️⃣ 一句话总结
这篇论文提出了一种名为离散伴随薛定谔桥采样器的新方法,它成功地将原本用于连续空间的、高效的伴随匹配优化技术,扩展到了离散空间,从而能够更高效地训练出高质量的离散神经网络采样器。
离散伴随薛定谔桥采样器 / Discrete Adjoint Schrödinger Bridge Sampler
这篇论文提出了一种名为离散伴随薛定谔桥采样器的新方法,它成功地将原本用于连续空间的、高效的伴随匹配优化技术,扩展到了离散空间,从而能够更高效地训练出高质量的离散神经网络采样器。
利用深度时序神经分层架构与可解释AI预测开源软件可持续性 / Predicting Open Source Software Sustainability with Deep Temporal Neural Hierarchical Architectures and Explainable AI
这篇论文提出了一种结合时序数据和可解释AI的分层预测框架,能够以超过94%的准确率识别开源软件项目所处的生命周期阶段,从而帮助评估其多维度的可持续性,并发现贡献活动和社区参与是影响可持续性的关键信号。
互信息坍缩解释β-VAE解耦失败的原因 / Mutual Information Collapse Explains Disentanglement Failure in $β$-VAEs
这篇论文发现,在经典的β-VAE模型中,过强的正则化会导致潜在特征之间的互信息归零,从而破坏解耦效果,并提出了一种新的双参数模型来稳定地分离和控制这两个目标。
少训练,快推理:通过结构化稀疏性实现高效模型微调与压缩 / Train Less, Infer Faster: Efficient Model Finetuning and Compression via Structured Sparsity
这篇论文提出了一种通过结构化稀疏化来微调大语言模型的新方法,它无需大量调整权重,只需训练极少的参数就能让模型适应新任务,同时还能减少模型体积、加快推理速度,并且性能优于现有的主流微调技术。
克里金法与大型神经网络之间的联系 / The Connection between Kriging and Large Neural Networks
这篇论文探讨了空间统计学中的克里金法(及其对应的机器学习方法高斯过程回归)与大型神经网络之间看似不同实则紧密的联系,并指出理解这种关系有助于提升机器学习模型的可解释性、可靠性和空间感知能力。
SDFed:通过子空间精炼与差异控制解决联邦提示学习中的本地-全局差异问题 / SDFed: Bridging Local Global Discrepancy via Subspace Refinement and Divergence Control in Federated Prompt Learning
这篇论文提出了一种名为SDFed的新方法,它允许不同设备在保护隐私的联合训练中,根据自身数据特点和计算能力灵活调整学习参数,并通过精巧的设计减少局部优化与全局共享知识之间的冲突,从而在数据分布和设备资源不均的现实场景下,显著提升了视觉-语言大模型的适应效果和鲁棒性。
PTS-SNN:一种用于高效语音情感识别的提示调优时序移位脉冲神经网络 / PTS-SNN: A Prompt-Tuned Temporal Shift Spiking Neural Networks for Efficient Speech Emotion Recognition
这篇论文提出了一种名为PTS-SNN的新型高效神经网络模型,它通过创新的提示调优和时序移位技术,成功地将节能的脉冲神经网络与强大的预训练语音模型结合,从而在保持高精度的同时,大幅降低了语音情感识别任务的计算成本和能耗,使其更适合在手机等资源有限的设备上运行。
无需分布假设的鲁棒函数预测-然后-优化 / Distribution-Free Robust Functional Predict-Then-Optimize
这篇论文提出了一种新方法,为用于快速求解偏微分方程的神经网络算子模型提供了无需假设数据分布、可计算的不确定性度量,并将这种不确定性量化应用于下游的鲁棒决策任务,从而在保证决策质量的同时,避免了传统方法对数据分布的苛刻假设或计算量过大的问题。
因果薛定谔桥:结构流形上的约束最优传输 / Causal Schrödinger Bridges: Constrained Optimal Transport on Structural Manifolds
这篇论文提出了一种名为‘因果薛定谔桥’的新方法,它利用扩散过程将因果推理中的反事实推断问题转化为一个鲁棒的最优传输问题,从而在处理数据分布发生剧烈变化的干预任务时,比传统的确定性模型更稳定、更准确。
通过分布鲁棒优化学习可信集合 / Learning Credal Ensembles via Distributionally Robust Optimization
这篇论文提出了一种名为CreDRO的新方法,通过训练一组在不同数据分布假设下的模型来更全面地评估预测中的认知不确定性,从而在数据分布发生变化时(例如医疗应用或异常检测中)获得更可靠、更鲁棒的预测结果。
请先 登录 后再提交论文