arXiv ID:
2509.18293
arXiv 提交日期: 2025-09-22
评估大型语言模型在检测反犹主义内容中的表现 / Evaluating Large Language Models for Detecting Antisemitism
1️⃣ 一句话总结
这篇论文通过提出一种新的提示方法Guided-CoT,评估了八种开源大语言模型在检测反犹主义内容方面的能力,发现该方法能有效提升模型性能、减少错误拒绝,并揭示了不同模型在解释性和可靠性上的显著差异。