arXiv ID:
2603.02775
arXiv 提交日期: 2026-03-03
从解题者到辅导者:使用KMP-Bench评估大语言模型的教学智能 / From Solver to Tutor: Evaluating the Pedagogical Intelligence of LLMs with KMP-Bench
1️⃣ 一句话总结
这篇论文提出了一个名为KMP-Bench的综合性评估基准,专门用于测试大语言模型在K-8年级数学辅导中的教学能力,发现当前模型虽然擅长解题,但在遵循教学原则(如引导、解释、反馈)方面仍有不足,并证明使用高质量教学对话数据训练可以显著提升模型的辅导效果。