arXiv ID:
2603.03251
推测式推测解码 / Speculative Speculative Decoding
1️⃣ 一句话总结
这篇论文提出了一种名为‘推测式推测解码’的新方法,通过让模型在验证当前预测的同时,提前准备多种可能的后续预测,从而进一步并行化推理过程,将大语言模型的生成速度在现有加速技术基础上再提升最多2倍。
推测式推测解码 / Speculative Speculative Decoding
这篇论文提出了一种名为‘推测式推测解码’的新方法,通过让模型在验证当前预测的同时,提前准备多种可能的后续预测,从而进一步并行化推理过程,将大语言模型的生成速度在现有加速技术基础上再提升最多2倍。
用于长程推理的递归模型 / Recursive Models for Long-Horizon Reasoning
这篇论文提出了一种让AI模型通过递归调用自身来解决复杂长程问题的创新方法,理论上证明了该方法能突破现有模型处理长文本的限制,并在实验中成功训练了一个小模型,使其在复杂的逻辑推理任务上超越了更强大的主流大语言模型。
使用RLE进行语义分割的标记化 / Tokenizing Semantic Segmentation with RLE
这篇论文提出了一种新颖的通用方法,通过将图像和视频中的语义分割掩码转换为类似语言的离散标记序列,并利用自回归模型进行预测,从而统一处理图像和视频的分割任务,同时还能扩展到全景分割。
SparVAR:探索视觉自回归建模中的稀疏性以实现免训练加速 / SparVAR: Exploring Sparsity in Visual AutoRegressive Modeling for Training-Free Acceleration
这篇论文提出了一种名为SparVAR的免训练加速框架,它通过利用视觉自回归模型注意力机制中的稀疏特性,在不跳过高分辨率细节的情况下,显著提升了高分辨率图像生成的速度,同时保持了图像质量。
PnP-U3D:连接自回归与扩散的即插即用3D框架,实现统一理解与生成 / PnP-U3D: Plug-and-Play 3D Framework Bridging Autoregression and Diffusion for Unified Understanding and Generation
这篇论文提出了一个创新的3D人工智能框架,它巧妙地将擅长理解的‘自回归模型’和擅长生成的‘扩散模型’结合起来,让AI既能高效理解3D物体,又能高质量地生成和编辑3D内容,同时大幅降低了训练成本。
LISA:拉普拉斯上下文谱分析 / LISA: Laplacian In-context Spectral Analysis
这篇论文提出了一种名为LISA的新方法,它能让基于拉普拉斯算子的时间序列模型,在预测时仅根据一小段历史数据就自动调整自身参数,从而在系统动态变化时更准确地进行预测。
AR-MAP:自回归大语言模型是扩散大语言模型的隐式教师吗? / AR-MAP: Are Autoregressive Large Language Models Implicit Teachers for Diffusion Large Language Models?
这篇论文提出了一种名为AR-MAP的新方法,它巧妙地利用已经训练好的、能更好理解人类偏好的自回归大语言模型作为‘老师’,通过简单的权重调整,来快速提升另一种并行生成模型(扩散大语言模型)的性能,从而高效解决了后者直接训练困难的问题。
RemoteVAR:用于遥感变化检测的自回归视觉建模 / RemoteVAR: Autoregressive Visual Modeling for Remote Sensing Change Detection
这篇论文提出了一个名为RemoteVAR的新方法,它通过创新的自回归模型架构和训练策略,有效解决了遥感图像变化检测中像素级预测的难题,并在多个标准测试中超越了现有的主流方法。
UniX:统一自回归与扩散模型用于胸部X光片的理解与生成 / UniX: Unifying Autoregression and Diffusion for Chest X-Ray Understanding and Generation
这篇论文提出了一个名为UniX的新型医学基础模型,它通过将图像理解任务和图像生成任务分别交给自回归和扩散两个分支处理,并让它们通过跨模态注意力机制相互协作,从而在参数更少的情况下,同时实现了对胸部X光片的高质量理解和生成,性能媲美单一任务的专业模型。
VideoAR:通过下一帧与尺度预测的自回归视频生成 / VideoAR: Autoregressive Video Generation via Next-Frame & Scale Prediction
本文提出了首个大规模视觉自回归视频生成框架VideoAR,它通过结合多尺度下一帧预测与自回归建模,在显著提升生成效率的同时,达到了与主流扩散模型相媲美的视频质量,为高效且高质量的视频生成提供了新方案。
请先 登录 后再提交论文