← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: llm
详细标签: diffusion language models temporal dynamics self-consistency voting semantic stability reinforcement learning 或 搜索:

📄 论文总结


1️⃣ 一句话总结

这篇论文揭示了扩散大语言模型(dLLMs)在逐步去噪生成文本时存在的时间振荡现象(正确答案在中间步骤出现却被后续步骤覆盖),并提出两种创新方法——时间自一致性投票(测试时策略)和时间一致性强化(后训练方法),通过量化语义稳定性(TSE指标)显著提升了模型输出的可靠性和准确性。


2️⃣ 论文创新点

1. 时间振荡现象的发现与量化

2. 时间自一致性投票(测试时策略)

3. 时间语义熵(TSE)与一致性强化

4. 复合奖励函数设计


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表


(总结已合并重复术语与创新点,突出核心贡献与跨学科价值。)

📄 打开原文 PDF