arXiv ID:
2511.15848
Step-Audio-R1技术报告 / Step-Audio-R1 Technical Report
1️⃣ 一句话总结
这篇论文提出了首个音频推理模型Step-Audio-R1,通过创新的模态锚定推理蒸馏方法,成功让AI在理解声音时能够进行有效推理,在多项音频理解任务中超越了现有先进模型。
Step-Audio-R1技术报告 / Step-Audio-R1 Technical Report
这篇论文提出了首个音频推理模型Step-Audio-R1,通过创新的模态锚定推理蒸馏方法,成功让AI在理解声音时能够进行有效推理,在多项音频理解任务中超越了现有先进模型。
小模型,大逻辑:多样性驱动优化激发VibeThinker-1.5B具备大模型推理能力 / Tiny Model, Big Logic: Diversity-Driven Optimization Elicits Large-Model Reasoning Ability in VibeThinker-1.5B
这篇论文通过一种名为‘频谱到信号原则’的新方法,成功让仅有15亿参数的小模型VibeThinker-1.5B在数学推理任务上超越了参数规模大数百倍的大型模型,证明小模型通过高效训练也能具备强大的逻辑推理能力,大幅降低了AI研发成本。
MotionStream:基于交互式运动控制的实时视频生成 / MotionStream: Real-Time Video Generation with Interactive Motion Controls
这篇论文提出了一个名为MotionStream的实时视频生成系统,它通过将预训练模型转化为实时推理架构,解决了现有方法延迟高、无法交互的问题,能够在单个GPU上以最高29帧每秒的速度生成无限长的视频,让用户能够通过绘制轨迹或控制摄像机等方式实时看到视频生成效果。
SemCoT:通过语义对齐的隐式标记加速思维链推理 / SemCoT: Accelerating Chain-of-Thought Reasoning through Semantically-Aligned Implicit Tokens
这篇论文提出了一种名为SemCoT的新方法,通过将思维链推理过程压缩成语义对齐的隐式标记,在保持推理准确性的同时显著提升了大型语言模型的推理效率。
AdaSPEC:面向高效推测解码器的选择性知识蒸馏 / AdaSPEC: Selective Knowledge Distillation for Efficient Speculative Decoders
本文提出了一种名为AdaSPEC的新方法,通过选择性过滤难以学习的词汇来优化知识蒸馏过程,使得小模型在推测解码中能更有效地模仿大模型,从而显著提高推理速度而不损失生成质量。
BitNet蒸馏 / BitNet Distillation
这篇论文提出了一种名为BitDistill的轻量级方法,能够将现成的高精度大语言模型针对特定任务微调成仅使用1.58位(三元权重)的极简版本,在保持与原模型相当性能的同时,大幅降低了内存占用并提升了CPU推理速度。
LightReasoner:小语言模型能否教会大语言模型推理? / LightReasoner: Can Small Language Models Teach Large Language Models Reasoning?
这项研究提出了一种名为LightReasoner的新方法,通过对比大小语言模型在推理过程中的行为差异,让小模型帮助大模型识别并强化其关键推理优势,从而在显著减少计算资源和数据需求的同时,大幅提升大模型的数学推理能力。
当思考遇见事实:长上下文语言模型的可复用推理 / When Thoughts Meet Facts: Reusable Reasoning for Long-Context LMs
这篇论文提出了一种名为‘思维模板’的方法,通过复用历史推理过程来指导长上下文语言模型更有效地整合多来源证据,从而提升复杂推理任务的性能,并可将优化后的模板迁移到小型模型中。
ScaleDiff:为高级数学推理扩展难题规模 / ScaleDiff: Scaling Difficult Problems for Advanced Mathematical Reasoning
这篇论文提出了一种名为ScaleDiff的高效方法,通过自动筛选现有数据集中的难题并训练专门的生成器来大规模创造高难度数学问题,从而显著提升大型推理模型在复杂数学任务上的表现,同时大幅降低了计算成本和人工干预需求。
逆向工程推理用于开放式生成 / Reverse-Engineered Reasoning for Open-Ended Generation
这篇论文提出了一种名为REER的新方法,通过从已知的优秀解决方案逆向推导出潜在的逐步推理过程,有效解决了开放式创意生成中的深度推理难题,并基于此构建了一个大规模数据集,训练出的模型在多项任务中表现优于主流开源模型,甚至可与顶尖商业模型媲美。
请先 登录 后再提交论文