arXiv ID:
2508.19982
扩散语言模型在解码前已知答案 / Diffusion Language Models Know the Answer Before Decoding
1️⃣ 一句话总结
这项研究发现扩散语言模型在生成过程中很早就已确定正确答案,并提出了一种无需训练的动态解码方法,可在保持质量的同时将推理速度提升最高3.4倍。
扩散语言模型在解码前已知答案 / Diffusion Language Models Know the Answer Before Decoding
这项研究发现扩散语言模型在生成过程中很早就已确定正确答案,并提出了一种无需训练的动态解码方法,可在保持质量的同时将推理速度提升最高3.4倍。
MotionFlux:基于整流流匹配和偏好对齐的高效文本引导运动生成 / MotionFlux: Efficient Text-Guided Motion Generation through Rectified Flow Matching and Preference Alignment
这篇论文提出了一个结合TAPO偏好优化和MotionFlux高效生成框架的系统,能够根据文字描述快速生成语义准确、质量高的虚拟角色动作,解决了传统方法速度慢和语义对齐差的问题。
预测未来令牌顺序改进语言建模 / Predicting the Order of Upcoming Tokens Improves Language Modeling
这篇论文提出了一种名为令牌顺序预测的新训练方法,通过让模型学习排列未来词汇的顺序而非直接预测具体词汇,在多个标准测试中显著提升了语言模型的性能,且比现有方法更高效。
Visual-CoG:基于阶段感知强化学习与引导链的文生图生成方法 / Visual-CoG: Stage-Aware Reinforcement Learning with Chain of Guidance for Text-to-Image Generation
本文提出了一种名为Visual-CoG的新方法,通过分阶段奖励机制强化文生图模型对复杂文本的理解能力,显著提升了多属性和模糊提示下的图像生成质量。
QueryBandits:一种基于上下文多臂老虎机的查询重写框架,用于主动减少大语言模型的幻觉生成 / QueryBandits for Hallucination Mitigation: Exploiting Semantic Features for No-Regret Rewriting
本文提出了QueryBandits框架,它将查询重写建模为一个在线决策问题,利用查询的语义特征,通过上下文多臂老虎机方法动态选择最佳重写策略,以主动减少大语言模型(LLM)的幻觉生成,并在多个问答基准上显著优于静态重写和无重写基线。
请先 登录 后再提交论文