arXiv ID:
2512.13655
arXiv 提交日期: 2025-12-15
大语言模型能力消除方法比较分析:一项跨架构评估 / Comparative Analysis of LLM Abliteration Methods: A Cross-Architecture Evaluation
1️⃣ 一句话总结
这篇论文评估了四种用于移除大语言模型安全拒绝能力的工具在不同模型上的效果,发现数学推理能力受这些工具影响最大,为研究者选择合适工具提供了依据。