arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 124 最新: PRISM: Breaking the O(n) Memory Wall in Long-Context LLM Inference via O(1) Photonic Block Selection 03-24

arXiv ID: 2602.19225

arXiv 提交日期: 2026-02-22

llm agents model training credit assignment multi-turn optimization policy gradient agent training proximity weighting

基于邻近性的多轮优化：面向大语言模型智能体训练的实用信用分配方法 / Proximity-Based Multi-Turn Optimization: Practical Credit Assignment for LLM Agent Training

1️⃣ 一句话总结

这篇论文提出了一种名为ProxMO的新方法，它通过动态评估任务难度和步骤间的语义关联，更精准地识别并奖励大语言模型智能体在复杂多轮对话中的关键成功步骤，从而用更少的训练样本实现更高效的性能提升，并能轻松集成到现有的工业级训练流程中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19128

arXiv 提交日期: 2026-02-22

llm systems model training gpu kernel optimization evolutionary search world model code generation automated optimization

K-Search：通过协同演化内在世界模型实现大语言模型内核生成 / K-Search: LLM Kernel Generation via Co-Evolving Intrinsic World Model

1️⃣ 一句话总结

这篇论文提出了一种名为K-Search的新方法，它通过让一个大语言模型在优化过程中同步学习和演化一个‘世界模型’，来更智能地规划和生成高效的GPU计算内核，从而在复杂任务上显著超越了现有的自动优化方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19163

arXiv 提交日期: 2026-02-22

aigc multi-modal model training audio-video generation diffusion transformer preference optimization temporal alignment mixture-of-experts

JavisDiT++：面向联合音视频生成的统一建模与优化 / JavisDiT++: Unified Modeling and Optimization for Joint Audio-Video Generation

1️⃣ 一句话总结

这篇论文提出了一个名为JavisDiT++的新框架，它通过创新的专家混合模块、时序对齐技术和人类偏好优化方法，显著提升了根据文字描述同时生成高质量、音画同步视频的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18997

arXiv 提交日期: 2026-02-22

machine learning theory model training stochastic mirror descent implicit bias overparameterization matrix completion convergence analysis

矩阵随机镜像下降的隐式偏差与收敛性 / Implicit Bias and Convergence of Matrix Stochastic Mirror Descent

1️⃣ 一句话总结

这篇论文证明了在参数多于训练样本的过参数化场景下，用于多分类和矩阵补全问题的矩阵随机镜像下降算法会快速收敛到一个全局解，并且这个解由算法选择的特定‘镜像函数’唯一决定，从而揭示了算法在高维多输出问题中如何形成内在偏好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19390

arXiv 提交日期: 2026-02-22

systems model training model evaluation digital twins modeling & simulation ai integration predictive analytics hybrid modeling

数字孪生中的人工智能建模与仿真 / Artificial Intelligence for Modeling & Simulation in Digital Twins

1️⃣ 一句话总结

这篇论文探讨了人工智能、建模与仿真以及数字孪生三者之间如何相互促进，共同推动更智能、更集成的系统发展。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20194

arXiv 提交日期: 2026-02-22

systems machine learning model training federated learning continuous-time markov chain infrastructure assessment hazard model federated averaging

基于联邦平均的连续时间马尔可夫链风险模型用于联邦桥梁退化评估 / FedAvg-Based CTMC Hazard Model for Federated Bridge Deterioration Assessment

1️⃣ 一句话总结

本文提出了一种基于联邦学习的桥梁退化评估方法，让多个机构能在不共享敏感原始数据的情况下，共同训练一个连续时间马尔可夫链风险模型，从而获得比仅使用本地数据更准确的全局基准模型，用于支持基于证据的桥梁全生命周期规划。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19066

arXiv 提交日期: 2026-02-22

natural language processing model training machine learning diffusion language models inverse distillation text generation inference acceleration discrete diffusion

IDLM：逆向蒸馏扩散语言模型 / IDLM: Inverse-distilled Diffusion Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为IDLM的新方法，通过将一种名为“逆向蒸馏”的技术应用到文本生成模型中，成功地将扩散语言模型的推理速度提升了4到64倍，同时保持了生成文本的质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18904

arXiv 提交日期: 2026-02-21

model training machine learning theory vector quantization autoencoders differentiable pca generative models latent representation

PCA-VAE：无需码书坍缩的可微分子空间量化 / PCA-VAE: Differentiable Subspace Quantization without Codebook Collapse

1️⃣ 一句话总结

这篇论文提出了一种名为PCA-VAE的新模型，它用简单、可微分的在线主成分分析替代了传统向量量化，从而在图像重建质量更高、使用比特数更少的同时，避免了码书坍陷等问题，并能自动学习到具有可解释性的语义特征。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18915

arXiv 提交日期: 2026-02-21

biology medical model training protein design generative ai gene therapy capsid engineering multi-objective optimization

AAVGen：用于肾脏选择性靶向的腺相关病毒衣壳的精准工程 / AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting

1️⃣ 一句话总结

这篇论文提出了一个名为AAVGen的人工智能生成框架，它能够从头设计出在产量、肾脏靶向性和热稳定性等多个关键性能上同时得到优化的新型腺相关病毒衣壳，为开发下一代基因治疗载体提供了高效的数据驱动方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.18066

arXiv 提交日期: 2026-02-20

computer vision model training autonomous driving bev segmentation self-supervised learning multi-camera perception semantic mapping pretraining

更快训练，更少标注：用于细粒度鸟瞰图分割的自监督预训练 / Faster Training, Fewer Labels: Self-Supervised Pretraining for Fine-Grained BEV Segmentation

1️⃣ 一句话总结

这篇论文提出了一种用于自动驾驶中鸟瞰图精细分割的两阶段训练方法，通过自监督预训练利用图像伪标签学习通用特征，使得后续监督微调阶段仅需一半的标注数据和三分之二的训练时间，就能获得比完全监督基线模型更好的分割效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.19225

1️⃣ 一句话总结

arXiv ID: 2602.19128

1️⃣ 一句话总结

arXiv ID: 2602.19163

1️⃣ 一句话总结

arXiv ID: 2602.18997

1️⃣ 一句话总结

arXiv ID: 2602.19390

1️⃣ 一句话总结

arXiv ID: 2602.20194

1️⃣ 一句话总结

arXiv ID: 2602.19066

1️⃣ 一句话总结

arXiv ID: 2602.18904

1️⃣ 一句话总结

arXiv ID: 2602.18915

1️⃣ 一句话总结

arXiv ID: 2602.18066

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.19225 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19128 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19163 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18997 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19390 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20194 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19066 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18904 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18915 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.18066 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.19225

arXiv ID: 2602.19128

arXiv ID: 2602.19163

arXiv ID: 2602.18997

arXiv ID: 2602.19390

arXiv ID: 2602.20194

arXiv ID: 2602.19066

arXiv ID: 2602.18904

arXiv ID: 2602.18915

arXiv ID: 2602.18066