arXiv ID:
2606.24585
arXiv 提交日期: 2026-06-23
针对法律语境提示的大语言模型过度拒绝:小型本地大语言模型在刑事法律语境中的表现 / LLMs Prompted for Legal Context Object More: Overrefusal from Small On-Premises LLMs in Criminal Legal Context
1️⃣ 一句话总结
该论文研究了小型本地部署大语言模型在刑事法律场景下的“过度拒绝”现象,发现添加如“你正在担任国家最高法院助理”这类权威身份提示词,会使模型拒绝提供帮助的概率比无提示时增加2到20倍,而角色扮演式的“越狱”提示效果则因模型而异,这表明法律专业人士日常使用这些模型时可能无意中引入偏见。