arXiv ID:
2606.18936
SciRisk-Bench:面向AI4Science安全的风险维度感知基准 / SciRisk-Bench: A Risk-Dimension-Aware Benchmark for AI4Science Safety
1️⃣ 一句话总结
本文提出了一个名为SciRisk-Bench的新型安全评估基准,通过系统涵盖7个学科、31个子学科和10种风险维度,专门用于衡量大语言模型在辅助科学研究(如回答问题、分析文献或规划实验)时能否识别并避免潜在风险,从而帮助研究者发现模型在哪些具体领域和风险类型上仍存在安全隐患。