arXiv ID:
2512.17206
arXiv 提交日期: 2025-12-19
推理调色板:通过潜在情境化调节推理,实现(视觉)语言模型的可控探索 / Reasoning Palette: Modulating Reasoning via Latent Contextualization for Controllable Exploration for (V)LMs
1️⃣ 一句话总结
这篇论文提出了一种名为‘推理调色板’的新方法,它通过一个可学习的潜在变量来引导大型语言模型在生成答案前先进行内部‘策略规划’,从而让模型能够探索更多样、更高效的推理路径,最终提升其推理能力和学习效率。