arXiv ID:
2603.00883
arXiv 提交日期: 2026-03-01
有知识而无智慧:衡量大语言模型与预期影响之间的错位 / Knowledge without Wisdom: Measuring Misalignment between LLMs and Intended Impact
1️⃣ 一句话总结
这篇研究发现,尽管大语言模型在标准测试上表现出色,但在教育儿童等实际任务中,它们的行为与人类专家的期望存在系统性偏差,甚至可能对学习效果产生负面影响,而这种偏差主要源于模型预训练阶段的共同缺陷。