arXiv ID:
2512.18880
arXiv 提交日期: 2025-12-21
大型语言模型在预测题目难度时与人类认知困难的对齐问题 / Can LLMs Estimate Student Struggles? Human-AI Difficulty Alignment with Proficiency Simulation for Item Difficulty Prediction
1️⃣ 一句话总结
本研究通过大规模实证分析发现,大型语言模型在预测题目难度时与人类真实感知存在系统性错位,模型倾向于收敛于一种“机器共识”而非对齐人类认知,其强大的问题解决能力反而可能阻碍准确的难度估计,并揭示了模型在元认知和模拟特定熟练度学生方面的根本性局限。