arXiv ID:
2606.03036
TriEval:一种用于评估大语言模型偏见、有害性和真实性的资源高效流水线 / TriEval: A Resource-Efficient Pipeline for LLM Bias, Toxicity, and Truthfulness Assessment
1️⃣ 一句话总结
本文提出了一种名为TriEval的轻量化评估工具,能在普通笔记本电脑上同时检测大语言模型在偏见、有害性和真实性三个方面的表现,无需昂贵的GPU集群,从而让更多资源有限的科研人员也能使用。