arXiv最新AI论文速览速学

🔍

标签: #speculative decoding ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 89 72小时内新更新论文 72h更新 189 最新: Accelerating RL Post-Training Rollouts via System-Integrated Speculative Decoding 04-30

arXiv ID: 2604.26779

arXiv 提交日期: 2026-04-29

llm systems reinforcement learning rollout acceleration speculative decoding post-training throughput optimization asynchronous pipeline

通过系统集成的推测解码加速强化学习后训练中的推理生成 / Accelerating RL Post-Training Rollouts via System-Integrated Speculative Decoding

1️⃣ 一句话总结

本文提出在强化学习后训练阶段，通过集成推测解码技术（一种无损加速方法）来加速自回归推理生成，实验证明在8B参数模型下同步RL可将推理吞吐量提升1.8倍，并预测在235B规模下异步RL可带来2.5倍的端到端训练加速。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.14626

arXiv 提交日期: 2026-04-16

systems model training llm mixture of experts speculative decoding hardware acceleration 3d stacking energy efficiency

ELMoE-3D：利用专家混合模型的内在弹性，通过混合键合技术实现本地部署中的自推测解码 / ELMoE-3D: Leveraging Intrinsic Elasticity of MoE for Hybrid-Bonding-Enabled Self-Speculative Decoding in On-Premises Serving

1️⃣ 一句话总结

这篇论文提出了一种名为ELMoE-3D的软硬件协同设计框架，它通过创新的‘弹性自推测解码’技术，有效结合了缓存加速和推测解码，从而显著提升了专家混合大模型在本地服务器上的运行速度和能效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.15244

arXiv 提交日期: 2026-04-16

llm model training systems speculative decoding reasoning verification inference acceleration step-level verification

从令牌到步骤：面向验证的推测解码以实现高效多步推理 / From Tokens to Steps: Verification-Aware Speculative Decoding for Efficient Multi-Step Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为SpecGuard的新方法，它通过利用模型内部信号对推理步骤进行整体验证和选择，在提高大型语言模型多步推理准确率的同时，还降低了计算延迟。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.12989

arXiv 提交日期: 2026-04-14

llm model training systems speculative decoding inference acceleration diffusion models autoregressive generation attention masking

利用块扩散草稿树加速推测解码 / Accelerating Speculative Decoding with Block Diffusion Draft Trees

1️⃣ 一句话总结

这篇论文提出了一种名为DDTree的新方法，它通过改进现有的块扩散草稿模型，构建一个多分支的“草稿树”来预测更多可能的后续文本，从而让大型语言模型在生成文本时能一次性验证多个候选路径，显著提升了文本生成的速度和效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.05417

arXiv 提交日期: 2026-04-07

llm model training systems speculative decoding inference acceleration multi-armed bandit dynamic resource allocation multi-drafter

基于对齐反馈的多起草者推测解码 / Multi-Drafter Speculative Decoding with Alignment Feedback

1️⃣ 一句话总结

这篇论文提出了一个名为MetaSD的统一框架，通过整合多个擅长不同任务的‘起草者’模型并利用反馈动态选择它们，来显著提升大语言模型的推理速度，同时保证生成质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.28049

arXiv 提交日期: 2026-03-30

model training computer vision multi-modal autoregressive diffusion speculative decoding single-step generation entropy-guided acceleration visual synthesis

漂移-AR：通过反对称漂移实现单步视觉自回归生成 / Drift-AR: Single-Step Visual Autoregressive Generation via Anti-Symmetric Drifting

1️⃣ 一句话总结

这篇论文提出了一种名为Drift-AR的新方法，它巧妙地利用生成过程中的不确定性信号，统一加速了图像生成的两个关键阶段，最终实现了仅需一步就能生成高质量图像，速度提升了3.8到5.5倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.18599

arXiv 提交日期: 2026-03-19

model training aigc multi-modal speculative decoding text-to-image inference acceleration autoregressive generation jacobi decoding

SJD-PAC：通过主动草拟与自适应延续加速推测性雅可比解码 / SJD-PAC: Accelerating Speculative Jacobi Decoding via Proactive Drafting and Adaptive Continuation

1️⃣ 一句话总结

这篇论文提出了一种名为SJD-PAC的改进方法，通过主动预测高难度区域的图像内容并允许在首次预测失败后继续尝试而非完全重来，从而在不损失图像质量的前提下，将文本生成图像的推理速度提升了约3.8倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.18567

arXiv 提交日期: 2026-03-19

llm systems model training speculative decoding training framework inference acceleration eagle-3 open-source

SpecForge：一个用于推测解码的灵活高效开源训练框架 / SpecForge: A Flexible and Efficient Open-Source Training Framework for Speculative Decoding

1️⃣ 一句话总结

本文提出了一个名为SpecForge的开源框架，它通过优化训练流程和提供高质量预训练模型，有效解决了大语言模型推理速度慢的难题，能显著提升文本生成效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.17573

arXiv 提交日期: 2026-03-18

robotics multi-modal model training speculative decoding vision-language-action robot control inference acceleration kinematic awareness

HeiSD：具有运动学感知的具身视觉-语言-动作模型的混合推测解码 / HeiSD: Hybrid Speculative Decoding for Embodied Vision-Language-Action Models with Kinematic Awareness

1️⃣ 一句话总结

这篇论文提出了一种名为HeiSD的混合推测解码框架，通过分析机器人轨迹模式，将两种推测解码方法智能结合并优化，从而在保证任务成功率的同时，显著提升了机器人控制模型的推理速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03251

arXiv 提交日期: 2026-03-03

llm model training systems speculative decoding inference acceleration parallel verification autoregressive models optimization

推测式推测解码 / Speculative Speculative Decoding

1️⃣ 一句话总结

这篇论文提出了一种名为‘推测式推测解码’的新方法，通过让模型在验证当前预测的同时，提前准备多种可能的后续预测，从而进一步并行化推理过程，将大语言模型的生成速度在现有加速技术基础上再提升最多2倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.26779

1️⃣ 一句话总结

arXiv ID: 2604.14626

1️⃣ 一句话总结

arXiv ID: 2604.15244

1️⃣ 一句话总结

arXiv ID: 2604.12989

1️⃣ 一句话总结

arXiv ID: 2604.05417

1️⃣ 一句话总结

arXiv ID: 2603.28049

1️⃣ 一句话总结

arXiv ID: 2603.18599

1️⃣ 一句话总结

arXiv ID: 2603.18567

1️⃣ 一句话总结

arXiv ID: 2603.17573

1️⃣ 一句话总结

arXiv ID: 2603.03251

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.26779 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.14626 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.15244 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.12989 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.05417 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.28049 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.18599 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.18567 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.17573 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03251 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.26779

arXiv ID: 2604.14626

arXiv ID: 2604.15244

arXiv ID: 2604.12989

arXiv ID: 2604.05417

arXiv ID: 2603.28049

arXiv ID: 2603.18599

arXiv ID: 2603.18567

arXiv ID: 2603.17573

arXiv ID: 2603.03251