arXiv ID:
2603.03251
推测式推测解码 / Speculative Speculative Decoding
1️⃣ 一句话总结
这篇论文提出了一种名为‘推测式推测解码’的新方法,通过让模型在验证当前预测的同时,提前准备多种可能的后续预测,从而进一步并行化推理过程,将大语言模型的生成速度在现有加速技术基础上再提升最多2倍。
推测式推测解码 / Speculative Speculative Decoding
这篇论文提出了一种名为‘推测式推测解码’的新方法,通过让模型在验证当前预测的同时,提前准备多种可能的后续预测,从而进一步并行化推理过程,将大语言模型的生成速度在现有加速技术基础上再提升最多2倍。
SIGMark:一种用于视频扩散模型的、支持盲提取的可扩展生成中水印技术 / SIGMark: Scalable In-Generation Watermark with Blind Extraction for Video Diffusion
这篇论文提出了一种名为SIGMark的新方法,它能在AI生成视频的过程中直接嵌入看不见的水印,并且无需存储大量密钥就能高效地检测出来,同时还能有效抵抗视频在时间和空间上的修改,解决了现有技术成本高、不抗干扰的问题。
SUN:共享下一词预测以实现高效的多LLM解耦服务 / SUN: Shared Use of Next-token Prediction for Efficient Multi-LLM Disaggregated Serving
这篇论文提出了一种名为SUN的新方法,通过将大语言模型的解码部分冻结并共享给多个模型使用,显著提升了多模型同时服务时的GPU利用率和系统吞吐量,同时保持了模型的准确性。
在高隐私设置下自适应方法更优:一个随机微分方程的视角 / Adaptive Methods Are Preferable in High Privacy Settings: An SDE Perspective
这篇论文通过随机微分方程分析发现,在严格的差分隐私训练中,自适应优化方法(如DP-SignSGD、DP-Adam)因其超参数对隐私级别不敏感而比传统方法(如DP-SGD)更实用,尤其在隐私要求高或噪声大的场景下表现更优。
TC-Padé:用于扩散加速的轨迹一致性帕德逼近 / TC-Padé: Trajectory-Consistent Padé Approximation for Diffusion Acceleration
这篇论文提出了一种名为TC-Padé的新方法,它通过更精确的数学逼近和自适应策略来加速扩散模型的图像和视频生成过程,在减少计算步骤的同时保持高质量输出,显著超越了现有的加速技术。
ShipTraj-R1:通过组相对策略优化强化大语言模型中的船舶轨迹预测 / ShipTraj-R1: Reinforcing Ship Trajectory Prediction in Large Language Models via Group Relative Policy Optimization
这篇论文提出了一个名为ShipTraj-R1的新框架,它首次将大语言模型应用于船舶轨迹预测,通过创新的动态提示和奖励机制,使其在复杂真实场景下的预测精度超过了现有先进方法。
凸与非凸联邦学习中陈旧随机梯度的处理:递减步长是唯一所需 / Convex and Non-convex Federated Learning with Stale Stochastic Gradients: Diminishing Step Size is All You Need
这篇论文证明,在分布式联邦学习场景中,当各参与方的梯度信息可能存在延迟、偏差或陈旧时,使用预先设定好的递减步长策略,就能达到与复杂自适应步长方法相同的优化效果,并且适用于非凸和强凸目标函数。
面向杂乱环境中序列化操作的物体中心空间推理学习 / Learning Object-Centric Spatial Reasoning for Sequential Manipulation in Cluttered Environments
这篇论文提出了一个名为Unveiler的机器人操作框架,它将复杂的空间推理与具体动作执行分离开来,通过一个轻量级的决策模块智能地识别并移除遮挡物,从而让机器人能更高效、更成功地从极度杂乱的环境中取出目标物体。
用于高分辨率材料参数重建的神经电磁场 / Neural Electromagnetic Fields for High-Resolution Material Parameter Reconstruction
这篇论文提出了一种名为NEMF的新方法,它能够仅通过非接触式的图像和射频信号,就能为真实场景构建出不仅外观逼真、还能进行物理仿真的‘功能数字孪生体’,其核心在于巧妙地分离并解决了场景几何、环境场和材料属性这三个纠缠在一起的难题。
CoShadow:基于扩散模型的多物体阴影生成用于图像合成 / CoShadow: Multi-Object Shadow Generation for Image Compositing via Diffusion Model
这篇论文提出了一种名为CoShadow的新方法,利用预训练的扩散模型为图像合成中同时插入的多个前景物体生成物理上合理且相互协调的阴影,解决了现有方法主要针对单物体且难以推广到多物体场景的局限性。
请先 登录 后再提交论文