arXiv ID:
2604.17730
MHSafeEval:大型语言模型心理健康安全性的角色感知交互级评估 / MHSafeEval: Role-Aware Interaction-Level Evaluation of Mental Health Safety in Large Language Models
1️⃣ 一句话总结
这篇论文提出了一个名为MHSafeEval的新评估框架,通过模拟多轮对话并分析AI在心理咨询中可能扮演的四种有害角色,来系统性地发现和诊断大型语言模型在心理健康应用中的安全隐患,弥补了现有静态评估方法的不足。