arXiv ID:
2602.05633
arXiv 提交日期: 2026-02-05
CASTLE:一个用于评估大语言模型中学生定制化个性化安全的综合基准 / CASTLE: A Comprehensive Benchmark for Evaluating Student-Tailored Personalized Safety in Large Language Models
1️⃣ 一句话总结
这篇论文提出了一个名为CASTLE的新评估基准,专门用来测试大语言模型在教育应用中能否根据不同学生的特点(如认知水平和心理状态)提供安全、个性化的回答,而不是对所有学生给出千篇一律的回应,实验发现当前主流模型在这方面都存在明显不足。