arXiv最新AI论文速览速学

🔍

标签: #training acceleration ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 88 72小时内新更新论文 72h更新 188 最新: EMA-FS: Accelerating GBDT Training via Gain-Informed Feature Screening 06-27

arXiv ID: 2606.26337

arXiv 提交日期: 2026-06-24

machine learning systems gradient boosted decision trees feature screening training acceleration histogram construction lightgbm

EMA-FS：通过增益感知特征筛选加速GBDT训练 / EMA-FS: Accelerating GBDT Training via Gain-Informed Feature Screening

1️⃣ 一句话总结

本文提出了一种名为EMA-FS的方法，通过追踪每个特征在训练过程中的历史贡献（增益），只保留最有用的特征来构建直方图，从而在不显著影响预测效果的前提下，将LightGBM等梯度提升决策树（GBDT）模型的训练速度提升1.3至2.6倍，尤其适用于中高维度的稠密数据。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28760

arXiv 提交日期: 2026-05-27

llm model training zeroth-order fine-tuning inference workload training acceleration vllm

大语言模型的零阶微调本质上是一种推理任务 / LLM Zeroth-Order Fine-Tuning is an Inference Workload

1️⃣ 一句话总结

本文发现，大语言模型的零阶微调（无需反向传播，仅靠多次前向评估）实际运行中大部分计算是重复的、类似推理的打分操作，因此将这一过程放到推理服务框架（如vLLM）中执行，相比传统训练循环可提升2.34到8.13倍速度，同时保持相近的模型准确率，为未来将轻量模型适配作为推理任务调度提供了新思路。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20708

arXiv 提交日期: 2026-05-20

computer vision model training diffusion transformers information routing residual stream image generation training acceleration

重新思考扩散Transformer中的跨层信息路由 / Rethinking Cross-Layer Information Routing in Diffusion Transformers

1️⃣ 一句话总结

本文系统分析了扩散Transformer模型中信息跨层流动的问题，发现传统残差连接会导致梯度衰减、信息冗余等三大症状，并提出了一种自适应路由机制（DAR），能在训练中动态调整每层信息的累积方式，大幅提升生成质量和训练效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05393

arXiv 提交日期: 2026-02-05

llm model training machine learning knowledge transfer training acceleration representation learning pretraining parameter efficiency

晚到早训练：让大语言模型学得更早，从而更快更好 / Late-to-Early Training: LET LLMs Learn Earlier, So Faster and Better

1️⃣ 一句话总结

这篇论文提出了一种名为‘晚到早训练’的新方法，它利用一个已经训练好的小模型来指导一个新的大模型在训练初期就学习到更深层的知识，从而显著加快训练速度并提升最终性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.17830

arXiv 提交日期: 2026-01-25

model training computer vision aigc diffusion models training acceleration variational autoencoder feature alignment efficient training

VAE-REPA：基于变分自编码器表征对齐的高效扩散模型训练方法 / VAE-REPA: Variational Autoencoder Representation Alignment for Efficient Diffusion Training

1️⃣ 一句话总结

这篇论文提出了一种名为VAE-REPA的轻量级方法，通过将扩散模型训练过程中的中间特征与预训练变分自编码器的特征进行对齐，来显著提升模型的训练效率和生成质量，且无需依赖额外的外部模型或复杂的双模型架构。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.26337

1️⃣ 一句话总结

arXiv ID: 2605.28760

1️⃣ 一句话总结

arXiv ID: 2605.20708

1️⃣ 一句话总结

arXiv ID: 2602.05393

1️⃣ 一句话总结

arXiv ID: 2601.17830

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.26337 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28760 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20708 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05393 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.17830 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.26337

arXiv ID: 2605.28760

arXiv ID: 2605.20708

arXiv ID: 2602.05393

arXiv ID: 2601.17830