arXiv最新AI论文速览速学

🔍

标签: #training efficiency ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: Once-For-All: A Train-Once and Select-Anytime Framework for Multimodal Instruction Tuning 05-27

arXiv ID: 2605.26761

arXiv 提交日期: 2026-05-26

machine learning multi-modal model training data selection multimodal instruction tuning vision language models transferable selector training efficiency

一次训练、随时选择：面向多模态指令微调的统一框架 / Once-For-All: A Train-Once and Select-Anytime Framework for Multimodal Instruction Tuning

1️⃣ 一句话总结

该论文提出一个名为OFA的多模态指令数据选择框架，通过仅训练一次轻量级选择器，即可无需重新计算地适用于不同数据集和不同视觉语言模型，仅用15%的数据就能达到甚至超过全量数据训练的模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20402

arXiv 提交日期: 2026-05-19

llm model training quantization error reinforcement learning mxfp4 error decomposition training efficiency

分解MXFP4量化误差以用于大语言模型强化学习：可约减的偏差、可恢复的死区和不可约的底噪 / Decomposing MXFP4 quantization error for LLM reinforcement learning: reducible bias, recoverable deadzone, and an irreducible floor

1️⃣ 一句话总结

该研究首次将MXFP4低精度计算在强化学习训练大语言模型时产生的量化误差，精确拆解为三种不同成分（缩放偏差、死区截断和网格噪声），并针对每种成分设计了专门的修复策略，从而在保持计算加速的同时，将模型性能恢复到接近或超过全精度（BF16）的水平。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.04547

arXiv 提交日期: 2026-05-06

audio model training machine learning diffusion model audio generation super-resolution training efficiency stage-aware optimization

阶段自适应音频扩散建模 / Stage-adaptive audio diffusion modeling

1️⃣ 一句话总结

本文提出一种根据训练阶段动态调整学习策略的方法，在音频扩散模型的早期侧重语义结构学习、后期侧重细节优化，从而在文本生成音频和音频超分辨率任务中显著提升训练效率和生成质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.07739

arXiv 提交日期: 2026-04-09

model training data systems recommendation systems data selection continual adaptation distributional drift training efficiency

生成式推荐系统持续适应的高效数据集选择方法 / Efficient Dataset Selection for Continual Adaptation of Generative Recommenders

1️⃣ 一句话总结

这篇论文提出了一种通过智能选择少量关键数据来高效更新推荐系统的方法，使其能持续适应用户行为变化，同时避免了大规模数据重训练带来的计算负担。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.17684

arXiv 提交日期: 2026-03-18

computer vision model training machine learning object detection training efficiency active sampling yolo curriculum learning

YOLO真的需要在每个训练周期都看遍所有图片吗？ / Does YOLO Really Need to See Every Training Image in Every Epoch?

1️⃣ 一句话总结

这篇论文提出了一种名为AFSS的智能采样策略，它能让YOLO系列目标检测器在训练时动态跳过已经学会的简单图片、重点学习困难图片，从而在不降低甚至提升检测精度的同时，显著加快训练速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.01875

arXiv 提交日期: 2026-03-02

llm model training systems knowledge distillation training efficiency inference optimization framework large language models

KDFlow：一个面向大语言模型、用户友好且高效的知识蒸馏框架 / KDFlow: A User-Friendly and Efficient Knowledge Distillation Framework for Large Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为KDFlow的新框架，它通过解耦教师模型推理和学生模型训练的架构，并采用创新的数据传输策略，显著提升了大语言模型知识蒸馏过程的效率和易用性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22718

arXiv 提交日期: 2026-02-26

reinforcement learning systems model training rlhf serverless computing training efficiency resource optimization synchronous training

RLHFless：基于无服务器计算的高效RLHF框架 / RLHFless: Serverless Computing for Efficient RLHF

1️⃣ 一句话总结

这篇论文提出了一个名为RLHFless的新框架，它利用无服务器计算技术来动态调配资源，从而显著提升了基于人类反馈的强化学习（RLHF）的训练效率并降低了成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21597

arXiv 提交日期: 2026-02-25

systems model training machine learning neural graph databases logical reasoning training efficiency semantic augmentation knowledge graphs

NGDB-Zoo：迈向高效可扩展的神经图数据库训练 / NGDB-Zoo: Towards Efficient and Scalable Neural Graph Databases Training

1️⃣ 一句话总结

这篇论文提出了一个名为NGDB-Zoo的新框架，通过将训练过程拆解成可并行执行的算子流并融入外部语义知识，大幅提升了神经图数据库的训练效率和推理表达能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20092

arXiv 提交日期: 2026-02-23

llm model training model evaluation data-efficient pretraining multilingual cognitively plausible weak model evaluation training efficiency

BabyLM 四岁了：2026年 BabyLM 研讨会征稿启事 / BabyLM Turns 4: Call for Papers for the 2026 BabyLM Workshop

1️⃣ 一句话总结

这篇论文是一份征稿启事，旨在通过举办第四届 BabyLM 竞赛和研讨会，鼓励研究者在数据高效预训练、多语言模型以及认知合理性等方向进行探索，以弥合认知建模与语言建模之间的界限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17270

arXiv 提交日期: 2026-02-19

model training computer vision multi-modal latent representation diffusion models image generation video generation training efficiency

统一潜变量（UL）：如何训练你的潜变量 / Unified Latents (UL): How to train your latents

1️⃣ 一句话总结

这篇论文提出了一个名为‘统一潜变量’的新框架，它通过巧妙结合扩散模型的先验知识和解码器，能够用更少的计算量高效地学习图像和视频数据的压缩表示，并在多个基准测试中取得了领先的重建质量和生成效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.26761

1️⃣ 一句话总结

arXiv ID: 2605.20402

1️⃣ 一句话总结

arXiv ID: 2605.04547

1️⃣ 一句话总结

arXiv ID: 2604.07739

1️⃣ 一句话总结

arXiv ID: 2603.17684

1️⃣ 一句话总结

arXiv ID: 2603.01875

1️⃣ 一句话总结

arXiv ID: 2602.22718

1️⃣ 一句话总结

arXiv ID: 2602.21597

1️⃣ 一句话总结

arXiv ID: 2602.20092

1️⃣ 一句话总结

arXiv ID: 2602.17270

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.26761 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20402 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.04547 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.07739 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.17684 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.01875 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22718 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21597 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20092 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17270 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.26761

arXiv ID: 2605.20402

arXiv ID: 2605.04547

arXiv ID: 2604.07739

arXiv ID: 2603.17684

arXiv ID: 2603.01875

arXiv ID: 2602.22718

arXiv ID: 2602.21597

arXiv ID: 2602.20092

arXiv ID: 2602.17270