arXiv最新AI论文速览速学

🔍

model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 174 最新: Describe-Then-Act: Proactive Agent Steering via Distilled Language-Action World Models 03-25

arXiv ID: 2603.02964

arXiv 提交日期: 2026-03-03

computer vision model training machine learning anomaly detection foundation models wavelet attention industrial inspection synthetic data

利用基础模型合成与小波域注意力改进异常检测 / Improving Anomaly Detection with Foundation-Model Synthesis and Wavelet-Domain Attention

1️⃣ 一句话总结

这篇论文通过一个无需额外训练就能生成逼真异常样本的合成方法，以及一个能聚焦异常关键频率特征的小波注意力模块，有效解决了工业场景中异常样本稀缺和检测困难的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02709

arXiv 提交日期: 2026-03-03

natural language processing model training machine learning sequential recommendation representation learning knowledge distillation sensory attributes review analysis

基于感官感知的序列化推荐：通过评论提炼表征 / Sensory-Aware Sequential Recommendation via Review-Distilled Representations

1️⃣ 一句话总结

这篇论文提出了一个新方法，通过从商品评论中提炼出颜色、气味等感官属性来增强商品表征，从而让序列推荐系统更准确地理解用户偏好，提升推荐效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02649

arXiv 提交日期: 2026-03-03

machine learning model training theory optimization algorithms generalization error adam optimizer algorithmic stability convergence analysis

HomeAdam：Adam与AdamW算法有时“回家”以获得更好的可证明泛化性能 / HomeAdam: Adam and AdamW Algorithms Sometimes Go Home to Obtain Better Provable Generalization

1️⃣ 一句话总结

这篇论文提出了一种名为HomeAdam的新优化算法，它通过让Adam/W算法在某些步骤中切换回类似SGD的动量更新，在理论上同时实现了比原始Adam更快的收敛速度和更优的泛化性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02629

arXiv 提交日期: 2026-03-03

multi-modal model training machine learning anomaly detection incremental learning information bottleneck multimodal fusion catastrophic forgetting

迈向增量式统一多模态异常检测：从信息瓶颈视角增强多模态去噪 / Towards an Incremental Unified Multimodal Anomaly Detection: Augmenting Multimodal Denoising From an Information Bottleneck Perspective

1️⃣ 一句话总结

这篇论文提出了一种名为IB-IUMAD的新方法，通过结合Mamba解码器和信息瓶颈融合模块来过滤冗余和虚假特征，有效解决了多模态异常检测模型在学习新类别时容易忘记旧知识的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03239

arXiv 提交日期: 2026-03-03

multi-modal computer vision model training earth observation latent diffusion conditional generation multimodal data stochastic modeling

COP-GEN：基于潜在扩散Transformer的哥白尼地球观测数据生成器——专为随机性设计 / COP-GEN: Latent Diffusion Transformer for Copernicus Earth Observation Data -- Generation Stochastic by Design

1️⃣ 一句话总结

这篇论文提出了一个名为COP-GEN的随机生成模型，它能够根据地球观测中的一种或多种数据（如光学图像、雷达数据），灵活、逼真地生成其他缺失或相关类型的数据，并自然地反映数据本身固有的不确定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03278

arXiv 提交日期: 2026-03-03

robotics agents model training autonomous play trajectory warping keypoint correspondences imitation learning vision-language models

Tether：基于对应关系驱动轨迹扭曲的自主功能化交互学习 / Tether: Autonomous Functional Play with Correspondence-Driven Trajectory Warping

1️⃣ 一句话总结

这篇论文提出了一种名为Tether的新方法，它能让机器人像玩游戏一样自主探索和学习新任务：只需少量演示，机器人就能通过视觉关键点匹配来调整动作，并在现实环境中持续执行、评估和改进任务，从而自动生成大量高质量的训练数据来提升自身技能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03045

arXiv 提交日期: 2026-03-03

machine learning systems model training generative flow networks quantum compilation unitary synthesis transformers reinforcement learning

QFlowNet：基于生成流网络的快速、多样且高效的酉矩阵合成 / QFlowNet: Fast, Diverse, and Efficient Unitary Synthesis with Generative Flow Networks

1️⃣ 一句话总结

这篇论文提出了一个名为QFlowNet的新框架，它结合了生成流网络和Transformer模型，能够快速、高效地为量子计算机生成多种多样的高质量量子门电路，解决了传统强化学习方法训练慢、结果单一的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02866

arXiv 提交日期: 2026-03-03

computer vision multi-modal model training 3d reconstruction novel view synthesis gaussian splatting importance sampling sparse-view

用于稀疏视角新视图合成的分层高斯泼溅中的多模态先验引导重要性采样 / Multimodal-Prior-Guided Importance Sampling for Hierarchical Gaussian Splatting in Sparse-View Novel View Synthesis

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过融合图像颜色、语义和几何等多种信息来智能判断3D场景中哪些细节可以准确重建，从而在仅有少数几张照片的情况下，生成更清晰、更逼真的新视角图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02548

arXiv 提交日期: 2026-03-03

computer vision systems model training 3d reconstruction semantic scene understanding novel view synthesis gaussian splatting sparse view

SemGS：基于稀疏视图的前馈式语义3D高斯泼溅用于可泛化的场景理解 / SemGS: Feed-Forward Semantic 3D Gaussian Splatting from Sparse Views for Generalizable Scene Understanding

1️⃣ 一句话总结

这项研究提出了一种名为SemGS的新方法，它能够仅用少数几张照片就快速重建出带有物体类别信息的3D场景模型，并能从任意新角度生成清晰的语义分割图，大大提升了机器人在复杂环境中理解场景的效率和实用性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02753

arXiv 提交日期: 2026-03-03

biology model training machine learning protein design bayesian optimization genetic algorithm sequence optimization peptide binder

深度学习引导的进化优化用于蛋白质设计 / Deep learning-guided evolutionary optimization for protein design

1️⃣ 一句话总结

这项研究提出了一个名为BoGA的新方法，它巧妙地将进化算法和贝叶斯优化结合起来，能更高效地在海量的蛋白质序列中搜索和设计出具有特定功能（如结合特定毒素）的新蛋白质，从而加速药物和生物技术的开发。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.02964

1️⃣ 一句话总结

arXiv ID: 2603.02709

1️⃣ 一句话总结

arXiv ID: 2603.02649

1️⃣ 一句话总结

arXiv ID: 2603.02629

1️⃣ 一句话总结

arXiv ID: 2603.03239

1️⃣ 一句话总结

arXiv ID: 2603.03278

1️⃣ 一句话总结

arXiv ID: 2603.03045

1️⃣ 一句话总结

arXiv ID: 2603.02866

1️⃣ 一句话总结

arXiv ID: 2603.02548

1️⃣ 一句话总结

arXiv ID: 2603.02753

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.02964 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02709 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02649 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02629 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03239 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03278 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03045 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02866 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02548 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02753 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.02964

arXiv ID: 2603.02709

arXiv ID: 2603.02649

arXiv ID: 2603.02629

arXiv ID: 2603.03239

arXiv ID: 2603.03278

arXiv ID: 2603.03045

arXiv ID: 2603.02866

arXiv ID: 2603.02548

arXiv ID: 2603.02753