arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 174 最新: Describe-Then-Act: Proactive Agent Steering via Distilled Language-Action World Models 03-25

arXiv ID: 2602.16233

arXiv 提交日期: 2026-02-18

systems model training machine learning quantum neural networks circuit cutting distributed training benchmark systems overhead

分布式估计器：通过电路切割实现量子神经网络的分布式训练 / DistributedEstimator: Distributed Training of Quantum Neural Networks via Circuit Cutting

1️⃣ 一句话总结

这篇论文提出了一种将大型量子电路切割成多个小电路进行分布式训练的新方法，并通过实验发现，虽然该方法能保持模型精度，但重建小电路结果的计算开销很大，是限制其性能提升的主要瓶颈。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16681

arXiv 提交日期: 2026-02-18

multi-modal model training model evaluation time series anomaly detection zero-shot learning vision-language alignment contrastive learning temporal modeling

VETime：视觉增强的零样本时间序列异常检测 / VETime: Vision Enhanced Zero-Shot Time Series Anomaly Detection

1️⃣ 一句话总结

这篇论文提出了一个名为VETime的新框架，它通过巧妙地将时间序列数据与视觉表示对齐并融合，有效结合了两种模型的优势，从而在无需特定数据训练的情况下，更精准地检测出时间序列中的各类异常点。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16629

arXiv 提交日期: 2026-02-18

reinforcement learning theory model training temporal difference learning average reward convergence analysis markov decision processes off-policy learning

平均奖励马尔可夫决策过程中差分时序差分学习的几乎必然收敛性 / Almost Sure Convergence of Differential Temporal Difference Learning for Average Reward Markov Decision Processes

1️⃣ 一句话总结

这篇论文为强化学习中用于评估长期性能的平均奖励算法提供了更实用的理论保证，证明了差分时序差分学习在更贴近实际应用的条件下也能稳定收敛。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16173

arXiv 提交日期: 2026-02-18

agents model training machine learning personalized agents human feedback continual learning preference modeling explicit memory

从人类反馈中学习个性化智能体 / Learning Personalized Agents from Human Feedback

1️⃣ 一句话总结

这篇论文提出了一个名为PAHF的框架，让AI智能体能够通过与用户的实时互动，持续学习和适应每个用户独特且可能变化的个人偏好，从而提供更贴心的服务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16490

arXiv 提交日期: 2026-02-18

llm model training theory iterative computation model depth reasoning layer looping depth growth

从深度增长到循环：大语言模型中迭代计算的统一视角 / From Growing to Looping: A Unified View of Iterative Computation in LLMs

1️⃣ 一句话总结

这篇论文发现，让大语言模型通过‘深度增长’（训练时由浅入深）和‘循环’（推理时重复使用某些层）两种方式提升推理能力，其背后的工作机制本质上是相同的，都是通过一种迭代计算过程来实现，并且这两种方法可以相互结合，进一步放大效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16601

arXiv 提交日期: 2026-02-18

model training theory machine learning diffusion models error propagation model collapse synthetic data theoretical analysis

扩散模型中的误差传播与模型崩溃：一项理论研究 / Error Propagation and Model Collapse in Diffusion Models: A Theoretical Study

1️⃣ 一句话总结

这篇论文从理论上分析了扩散模型在反复使用自身生成的合成数据进行训练时，其生成质量会如何因误差累积而逐渐恶化，并揭示了这种‘模型崩溃’现象在不同训练数据配比下的变化规律。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16634

arXiv 提交日期: 2026-02-18

biology machine learning model training diffusion models rare event sampling free energy calculation molecular dynamics biomolecular simulation

增强扩散采样：利用扩散模型实现高效稀有事件采样与自由能计算 / Enhanced Diffusion Sampling: Efficient Rare Event Sampling and Free Energy Calculation with Diffusion Models

1️⃣ 一句话总结

这篇论文提出了一种名为‘增强扩散采样’的新方法，通过结合扩散模型与精确的偏置采样技术，高效解决了分子模拟中稀有事件（如蛋白质折叠）的采样难题，从而能够快速、准确地计算自由能等关键物理量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16476

arXiv 提交日期: 2026-02-18

machine learning data model training preference learning ranking data inverse probability weighting exposure bias correction recommendation systems

从观察到的排名中学习偏好 / Learning Preference from Observed Rankings

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过分析消费者对商品的排名数据来学习他们的个人偏好，并解决了数据中常见的‘热门商品曝光偏差’问题，从而能更准确地预测消费者对新产品的购买行为。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16412

arXiv 提交日期: 2026-02-18

multi-modal model training video video understanding motion representation long-video multimodal llm compressed representation

ReMoRa：基于精细化运动表征的多模态大语言模型，用于长视频理解 / ReMoRa: Multimodal Large Language Model based on Refined Motion Representation for Long-Video Understanding

1️⃣ 一句话总结

这篇论文提出了一种名为ReMoRa的新模型，它通过直接处理视频压缩后的运动表征而非大量原始图像帧，高效地解决了多模态大模型理解长视频时计算量过大的难题，并在多个长视频理解测试中取得了领先效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16340

arXiv 提交日期: 2026-02-18

theory model training machine learning implicit bias optimization homogeneous networks momentum margin maximization

Adam和Muon优化器在平滑齐次神经网络上的隐式偏好 / The Implicit Bias of Adam and Muon on Smooth Homogeneous Neural Networks

1️⃣ 一句话总结

这篇论文通过理论分析和实验证明，在训练结构特殊的神经网络时，不同的动量优化算法（如Adam、Muon）会隐式地引导模型朝着不同几何意义上的“最优解”收敛，从而影响最终模型的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.16233

1️⃣ 一句话总结

arXiv ID: 2602.16681

1️⃣ 一句话总结

arXiv ID: 2602.16629

1️⃣ 一句话总结

arXiv ID: 2602.16173

1️⃣ 一句话总结

arXiv ID: 2602.16490

1️⃣ 一句话总结

arXiv ID: 2602.16601

1️⃣ 一句话总结

arXiv ID: 2602.16634

1️⃣ 一句话总结

arXiv ID: 2602.16476

1️⃣ 一句话总结

arXiv ID: 2602.16412

1️⃣ 一句话总结

arXiv ID: 2602.16340

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.16233 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16681 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16629 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16173 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16490 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16601 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16634 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16476 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16412 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16340 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.16233

arXiv ID: 2602.16681

arXiv ID: 2602.16629

arXiv ID: 2602.16173

arXiv ID: 2602.16490

arXiv ID: 2602.16601

arXiv ID: 2602.16634

arXiv ID: 2602.16476

arXiv ID: 2602.16412

arXiv ID: 2602.16340