arXiv ID:
2512.14693
通用推理模型 / Universal Reasoning Model
1️⃣ 一句话总结
这篇论文发现通用Transformer在复杂推理任务上的性能提升主要源于其循环结构和强大的非线性能力,并据此提出了一个结合短卷积和截断反向传播的改进模型,在ARC-AGI基准测试上取得了当前最好的成绩。
通用推理模型 / Universal Reasoning Model
这篇论文发现通用Transformer在复杂推理任务上的性能提升主要源于其循环结构和强大的非线性能力,并据此提出了一个结合短卷积和截断反向传播的改进模型,在ARC-AGI基准测试上取得了当前最好的成绩。
使用雅可比强制实现快速准确的因果并行解码 / Fast and Accurate Causal Parallel Decoding using Jacobi Forcing
这篇论文提出了一种名为‘雅可比强制’的训练方法,能够将传统顺序生成的大语言模型高效地转化为并行解码模型,在保持生成质量的同时,显著提升了推理速度。
WorldPlay:面向实时交互式世界建模的长期几何一致性研究 / WorldPlay: Towards Long-Term Geometric Consistency for Real-Time Interactive World Modeling
这篇论文提出了一个名为WorldPlay的实时视频生成模型,它通过创新的双动作控制、动态重建记忆和上下文强制蒸馏技术,解决了现有方法在速度与长期几何一致性之间的权衡问题,能够以24帧/秒的速度生成连贯且高质量的长视频。
VersatileFFN:通过自适应宽深复用实现大语言模型的参数高效化 / VersatileFFN: Achieving Parameter Efficiency in LLMs via Adaptive Wide-and-Deep Reuse
这篇论文提出了一种名为VersatileFFN的新型前馈网络,它通过在同一套固定参数内,自适应地复用参数来拓宽模型宽度或加深处理深度,从而在不增加内存开销的前提下,有效提升了大语言模型处理不同难度任务的能力。
MemFlow:用于一致且高效长视频叙事的自适应流动记忆 / MemFlow: Flowing Adaptive Memory for Consistent and Efficient Long Video Narratives
这篇论文提出了一个名为MemFlow的新方法,它通过动态选择和激活与当前生成内容最相关的历史画面来管理记忆,从而在生成超长视频时,既能高效地保持故事内容的连贯性,又几乎不影响生成速度。
高效扩散语言模型:从自回归到扩散语言模型的转换及速度提升 / Efficient-DLM: From Autoregressive to Diffusion Language Models, and Beyond in Speed
这篇论文提出了一种新方法,能够将训练好的自回归语言模型高效地转换成扩散语言模型,在保持原有模型准确性的同时,大幅提升了文本生成速度。
稀疏LaViDa:稀疏多模态离散扩散语言模型 / Sparse-LaViDa: Sparse Multimodal Discrete Diffusion Language Models
这篇论文提出了一种名为Sparse-LaViDa的新方法,它通过动态移除扩散模型推理过程中不必要的计算,将图像生成和编辑等任务的速度提升了一倍,同时保持了生成质量。
EVOLVE-VLA:基于环境反馈的视觉-语言-动作模型测试时训练框架 / EVOLVE-VLA: Test-Time Training from Environment Feedback for Vision-Language-Action Models
这篇论文提出了一个名为EVOLVE-VLA的新框架,让机器人视觉-语言-动作模型能在实际测试环境中通过与环境的互动来自主学习和改进,从而显著减少对大量人工演示数据的依赖,并提升其在陌生任务和复杂长序列任务中的适应能力。
RePo:具有上下文重定位能力的语言模型 / RePo: Language Models with Context Re-Positioning
这篇论文提出了一种名为RePo的新方法,它通过一个可学习的模块动态调整输入文本中词语的位置编码,从而帮助语言模型更有效地处理复杂或混乱的上下文信息,提升其在长文本、含噪声数据等任务上的推理能力。
TAT:面向一体化医学图像复原的任务自适应Transformer / TAT: Task-Adaptive Transformer for All-in-One Medical Image Restoration
这篇论文提出了一种名为TAT的新型任务自适应Transformer框架,它通过动态生成任务专属参数和智能平衡不同任务的损失权重,有效解决了多个医学图像复原任务同时训练时的相互干扰和优化不平衡问题,从而在一体化模型中实现了更优的性能。
请先 登录 后再提交论文