状态优于标记:重新概念化大语言模型中的推理标记 / State over Tokens: Characterizing the Role of Reasoning Tokens
1️⃣ 一句话总结
本文提出了“状态优于标记”的概念框架,认为大语言模型在最终答案前生成的推理标记序列,本质上是外部化的计算状态载体,而非对人类思维过程的忠实解释性文本。
2️⃣ 论文创新点
1. State over Tokens (SoT) 框架
- 创新点:将大语言模型生成的推理标记重新概念化为一种外部化的计算状态,而不是可读的语义文本。该框架认为这些标记是模型在无状态生成周期之间唯一持久的信息载体,用于编码和跨计算步骤传递状态。
- 区别/改进:突破了将推理标记视为模型推理过程忠实解释的流行观点,提供了更准确的功能性描述。它改变了理解LLM推理过程的范式,从关注标记的叙事意义转向其作为计算状态的功能性作用。
- 意义:为理解推理标记在LLMs中的真实作用提供了新的理论框架,揭示了其作为跨计算周期状态载体的核心功能,并引导出新的研究方向,如状态外部化决策、信息编码与传播等。
2. 推理标记与推理文本的区分
- 创新点:明确区分了LLM在最终答案前生成的标记序列(推理标记)与其英文解释(推理文本)。前者是支持产生最终答案的外部化计算状态,后者是面向人类、用于建立用户信任的可读描述,但不一定忠实反映模型的实际计算过程。
- 区别/改进:明确了推理标记的核心功能是支持产生最终答案,而推理文本是面向人类的可读描述。这有助于澄清关于LLM推理的常见误解,区分了表象与底层机制。
- 意义:有助于分析推理标记的计算角色与推理文本的社会信任功能之间的差异,为校准对模型输出的信任提供了理论基础。
3. 揭示编码任意性与共享意义误解
- 创新点:通过简单的编码变换(如给每个数加10)等示例论证,推理标记可能以完全不同于人类解读的方式运作,其表面文本对人类可能不透明但对LLM功能有效。这种编码方案可以是任意的,并延伸到非数值领域。
- 区别/改进:挑战了LLM会以人类相同方式解释中间文本的假设,并指出编码方案可以是任意的。这解释了为什么LLM的推理文本可能无法被人类直接理解其计算意图。
- 意义:解释了为什么LLM的推理文本可能无法被人类直接理解其计算意图,并为模型在推理文本中提及相关主题的现象提供了直觉。
4. 提出文本与状态的本体论分歧
- 创新点:论证了在SoT框架下,同一标记序列对人类读者和LLM模型分属根本不同的实体类别:对人类而言,它是遵循语言习惯解析出语义的文本;对模型而言,它是逐步积累以机械驱动下一步的计算基底。两者共享相同的体现形式但使用不同的语义系统。
- 区别/改进:超越了符号多义性的传统概念,指出这是两种不同实体(交流媒介与功能状态)共享同一体现形式。
- 意义:为理解LLM如何能将同一标记序列既用作可读文本又用作不透明计算基底提供了理论基础,揭示了人机解释的根本分歧。
5. 审视语言作为计算媒介的特殊性
- 创新点:探讨了自然语言作为离散标记计算媒介,是否比其他媒介(如向量、结构化格式)更适合编码LLM执行的计算,还是任意媒介都具有同等表达力。这引入了基于预训练数据语义一致性的归纳偏置假说。
- 区别/改进:挑战了SoT框架下媒介任意性的假设,引导研究去比较不同状态表示媒介的表现。
- 意义:引导研究去比较不同状态表示媒介的表现,深化对LLM计算本质的理解。
6. 揭示SoT作为忠实解释的根本张力
- 创新点:分析了推理标记同时作为驱动计算的状态和描述计算的解释所面临的固有冲突与瓶颈。提升解释忠实性的核心挑战在于单一媒介需同时满足计算效率和解释透明性这两个可能矛盾的需求。
- 区别/改进:将研究问题从“能否生成合理解释”提升到“自然语言标记媒介是否具备同时作为高效计算底板和透明描述记录的能力”这一根本层面。
- 意义:将研究问题提升到根本层面,明确了提升模型解释忠实性所面临的核心矛盾。
3️⃣ 主要结果与价值
结果亮点
- 通过计算卡塔兰数的例子,论证了中间结果序列(状态)是计算过程的一部分和推动前进的脚手架,而非计算本身,也不能从中可靠推断出计算步骤。
- 通过简单的加性编码变换示例,展示了推理标记的表面意义对人类可能不透明,但对LLM完全可用,且这种编码任意性可延伸到非数值领域。
实际价值
- 为校准用户对LLM生成推理文本的信任提供了清晰框架,帮助用户理解这些文本是功能性的状态载体,而非完整的、忠实的计算过程记录。
- 为模型可解释性研究提供了新视角,将关注点从内部特征涌现转向标记序列承载的计算状态,开辟了新的研究问题领域。
- 引导未来工作探索LLM如何通过标记构建和使用状态,以及自然语言作为计算介质的优势,有助于设计更高效、可靠的推理模型。
4️⃣ 术语表
- reasoning tokens:大语言模型在生成最终答案前输出的符号序列,包括‘therefore’、‘consider’等短语。在SoT框架下,其核心功能是作为跨模型无状态计算周期的外部化计算状态。
- State over Tokens (SoT):本文提出的概念框架,主张将推理标记解释为模型计算过程的状态载体,而非具有英语语义的可读文本,以更准确地理解其在大语言模型推理中的功能角色。
- reasoning text:推理标记的英文解释,读起来像推理工作的描述,用于建立用户信任,但不一定忠实反映模型的实际计算过程。
- encoded state:编码状态,指LLM在思维链推理过程中,通过生成的标记序列来编码、维护和使用的计算状态。
- faithful explanation:忠实解释,指模型生成的推理文本能够准确描述其内部实际发生的计算过程。在SoT框架下,这与token序列作为计算状态的功能性存在根本张力。
- Ontological Divergence:本体论分歧,指在SoT中,同一标记序列对人类读者和LLM模型而言属于根本不同的实体类别:前者是语义文本,后者是功能性的计算状态。
- Misconception of Completeness:完整性误解,一种错误理解,认为LLM生成的推理文本完整地描述了其内部计算过程。SoT视角指出,这些文本仅外化了下一计算周期所需的功能性状态。
- Chain-of-Thought (CoT):思维链,一种通过逐步推理来提升大语言模型性能的技术,在论文中被多次提及和研究。
- faithfulness:忠实性,在可解释性AI中,指模型提供的解释与其内部决策过程一致的程度,是评估解释可靠性的关键指标。
- Emergent World Representations:涌现的世界表征,指在序列模型训练过程中,模型内部自发形成的对世界状态或概念的表征。