arXiv最新AI论文速览速学

🔍

标签: #model training ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 249 最新: FASTER: Rethinking Real-Time Flow VLAs 03-20

arXiv ID: 2603.09255

arXiv 提交日期: 2026-03-10

computer vision robotics model training autonomous driving object detection lane detection behavioral cloning transfer learning

自动驾驶的多模型方法：关于交通标志、车辆与车道检测及行为克隆的综合研究 / Multi-model approach for autonomous driving: A comprehensive study on traffic sign-, vehicle- and lane detection and behavioral cloning

1️⃣ 一句话总结

这篇论文提出了一种结合预训练和定制神经网络的创新方法，通过数据增强和迁移学习等技术，有效提升了自动驾驶汽车在交通标志识别、车辆检测、车道预测和行为克隆等关键任务上的性能，为开发更安全可靠的自动驾驶系统提供了重要见解。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09657

arXiv 提交日期: 2026-03-10

video generation model training computer vision video diffusion attention control kv caching background consistency training-free

何时锁定注意力：视频扩散模型中的免训练KV控制 / When to Lock Attention: Training-Free KV Control in Video Diffusion

1️⃣ 一句话总结

这篇论文提出了一种名为KV-Lock的免训练方法，它能智能地判断何时需要锁定视频背景、何时需要增强前景生成，从而在视频编辑中同时实现高质量的前景和稳定的背景。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09571

arXiv 提交日期: 2026-03-10

theory model training machine learning optimal control transformer training mckean-vlasov dynamics dynamic programming quantization

一种基于最优控制的Transformer训练方法 / An Optimal Control Approach To Transformer Training

1️⃣ 一句话总结

这篇论文提出了一种基于最优控制理论的全新Transformer训练框架，通过将模型建模为粒子系统并提升到概率空间，证明了全局最优策略的存在性，并设计了一种量化训练方法，为传统梯度训练提供了一个不依赖平滑性或凸性的全局最优且鲁棒的替代方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08462

arXiv 提交日期: 2026-03-09

llm theory model training reasoning efficiency information bottleneck chain-of-thought reinforcement learning lossy compression

推理即压缩：通过条件信息瓶颈统一预算强制 / Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck

1️⃣ 一句话总结

这篇论文提出将大语言模型中的思维链推理视为一个压缩问题，通过一种新的条件信息瓶颈训练目标，在减少推理过程长度的同时，能更智能地保留关键逻辑信息，从而在控制计算成本的同时保持甚至提升任务准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08706

arXiv 提交日期: 2026-03-09

llm agents model training reinforcement learning self-reflection agent training reasoning imitation learning

自主批判性训练 / Agentic Critical Training

1️⃣ 一句话总结

这篇论文提出了一种名为‘自主批判性训练’的新方法，它通过让大型语言模型学习自主判断不同行动方案的优劣，而不是简单模仿专家行为，从而显著提升了AI代理的决策能力和泛化性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08647

arXiv 提交日期: 2026-03-09

model training machine learning llm fine-tuning catastrophic forgetting parameter expansion plasticity stability trade-off transformer adaptation

增长而非覆盖：实现无遗忘的模型微调 / Grow, Don't Overwrite: Fine-tuning Without Forgetting

1️⃣ 一句话总结

这篇论文提出了一种创新的模型微调方法，通过复制并扩展预训练模型的内部结构来学习新任务，从而在保持原有能力不丢失的同时，达到与完全微调相当的新任务性能，且计算成本更低。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08426

arXiv 提交日期: 2026-03-09

machine learning model training model evaluation class incremental learning catastrophic forgetting model compression dynamic scaling memory efficiency

生长、评估、压缩：面向内存高效类增量学习的自适应主干网络缩放 / Grow, Assess, Compress: Adaptive Backbone Scaling for Memory-Efficient Class Incremental Learning

1️⃣ 一句话总结

这篇论文提出了一种名为GRACE的自适应模型缩放框架，它通过‘生长、评估、压缩’的循环策略，在持续学习新任务时智能地管理模型规模，既有效防止了遗忘旧知识，又大幅降低了内存消耗。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08257

arXiv 提交日期: 2026-03-09

machine learning model training theory gradient estimation discrete latent variables variance reduction straight-through estimator variational autoencoder

超越ReinMax：面向离散隐变量的低方差梯度估计器 / Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables

1️⃣ 一句话总结

这篇论文提出了两种新的梯度估计方法（ReinMax-Rao和ReinMax-CV），通过在现有ReinMax方法中融入统计降噪技术，显著降低了模型训练中离散隐变量梯度估计的方差，从而提升了变分自编码器等模型的训练效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08182

arXiv 提交日期: 2026-03-09

llm natural language processing model training multilingual llm curriculum learning low-resource languages data imbalance model evaluation

TildeOpen LLM：利用课程学习实现公平的语言表征 / TildeOpen LLM: Leveraging Curriculum Learning to Achieve Equitable Language Representation

1️⃣ 一句话总结

这篇论文提出了一个名为TildeOpen LLM的300亿参数开源大语言模型，它通过巧妙的数据增广和课程学习训练策略，显著提升了34种欧洲语言（尤其是低资源语言）的处理能力，在减少计算资源消耗的同时实现了更公平的多语言性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08063

arXiv 提交日期: 2026-03-09

computer vision multi-modal model training cross-view geolocalization uav-satellite matching vision-language model relational modeling retrieval accuracy

通过大型视觉-语言模型驱动的关系建模增强跨视角无人机地理定位 / Enhancing Cross-View UAV Geolocalization via LVLM-Driven Relational Modeling

1️⃣ 一句话总结

这篇论文提出了一种利用大型视觉-语言模型来学习无人机与卫星图像之间深层关联的新方法，通过一个即插即用的关系建模模块和新型损失函数，显著提升了跨视角图像匹配的准确性和稳定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.09255

1️⃣ 一句话总结

arXiv ID: 2603.09657

1️⃣ 一句话总结

arXiv ID: 2603.09571

1️⃣ 一句话总结

arXiv ID: 2603.08462

1️⃣ 一句话总结

arXiv ID: 2603.08706

1️⃣ 一句话总结

arXiv ID: 2603.08647

1️⃣ 一句话总结

arXiv ID: 2603.08426

1️⃣ 一句话总结

arXiv ID: 2603.08257

1️⃣ 一句话总结

arXiv ID: 2603.08182

1️⃣ 一句话总结

arXiv ID: 2603.08063

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.09255 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09657 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09571 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08462 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08706 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08647 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08426 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08257 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08182 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08063 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.09255

arXiv ID: 2603.09657

arXiv ID: 2603.09571

arXiv ID: 2603.08462

arXiv ID: 2603.08706

arXiv ID: 2603.08647

arXiv ID: 2603.08426

arXiv ID: 2603.08257

arXiv ID: 2603.08182

arXiv ID: 2603.08063