🤖 系统
11-30 17:48
📄 论文总结
AthenaBench:用于评估网络威胁情报中大型语言模型的动态基准 / AthenaBench: A Dynamic Benchmark for Evaluating LLMs in Cyber Threat Intelligence
1️⃣ 一句话总结
这篇论文提出了一个名为AthenaBench的增强基准,用于评估大型语言模型在网络威胁情报任务中的表现,发现当前模型在推理密集型任务上仍有明显不足,强调需要开发专门针对该领域的模型。