arXiv ID:
2603.09452
arXiv 提交日期: 2026-03-10
CyberThreat-Eval:大型语言模型能自动化现实世界威胁研究吗? / CyberThreat-Eval: Can Large Language Models Automate Real-World Threat Research?
1️⃣ 一句话总结
这篇论文提出了一个名为CyberThreat-Eval的新评估基准,它基于真实网络安全威胁情报工作流程构建,用于测试大语言模型在自动化威胁分析任务中的实际能力,发现当前模型在处理复杂细节和辨别信息真伪方面仍有不足。