← 返回列表

菜单

🤖 系统
📄 Abstract - AthenaBench: A Dynamic Benchmarking Framework for Large Language Models in Cyber Threat Intelligence
正在获取摘要...
顶级标签: llm systems
详细标签: cybersecurity dynamic benchmarking threat intelligence model evaluation risk mitigation 或 搜索:

📄 论文总结

AthenaBench:网络威胁情报领域大语言模型动态基准测试框架 / AthenaBench: A Dynamic Benchmarking Framework for Large Language Models in Cyber Threat Intelligence


1️⃣ 一句话总结

AthenaBench是一个专门针对网络威胁情报领域设计的动态基准测试套件,通过改进数据集构建流程、去重机制和评估指标,并新增风险缓解策略任务,系统评估了12个大语言模型在复杂网络安全任务中的表现。


2️⃣ 论文创新点

1. 动态基准测试框架

2. 风险缓解策略任务

3. 动态数据构建机制

4. 威胁报告匿名化处理


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF