arXiv ID:
2607.01511
arXiv 提交日期: 2026-07-01
重新审视有限监督下的思维链推理:半监督思维链学习 / Revisiting Chain-of-Thought Reasoning under Limited Supervision: Semi-supervised Chain-of-Thought Learning
1️⃣ 一句话总结
本文提出了一种名为Semi-CoT的半监督思维链学习框架,通过利用无标签问题自动生成可靠的推理链作为训练信号,从而在减少人工标注成本的同时提升大语言模型的推理能力,实验在多个数学推理数据集上验证了其有效性,但也发现需要更优的策略来避免负迁移或性能瓶颈。