arXiv ID:
2601.07790
arXiv 提交日期: 2026-01-12
评估小型语言模型和推理模型在系统日志严重性分类任务上的表现 / Benchmarking Small Language Models and Small Reasoning Language Models on System Log Severity Classification
1️⃣ 一句话总结
这篇论文通过系统日志严重性分类这个任务,来测试多种小型AI模型的实际理解能力和部署效率,发现模型架构、训练目标和能否有效利用外部信息是决定其性能的关键,为实时监控系统的AI选型提供了重要参考。