arXiv ID:
2601.21909
arXiv 提交日期: 2026-01-29
从元思维到执行:基于认知对齐的后训练方法,实现大语言模型可泛化且可靠的推理 / From Meta-Thought to Execution: Cognitively Aligned Post-Training for Generalizable and Reliable LLM Reasoning
1️⃣ 一句话总结
这篇论文提出了一种模仿人类两阶段认知过程的大语言模型后训练新框架,先学习通用的抽象推理策略,再优化具体任务执行,从而在提升模型泛化能力和可靠性的同时,大幅减少了训练时间和计算资源消耗。