arXiv ID:
2602.07909
arXiv 提交日期: 2026-02-08
SparseEval:通过稀疏优化高效评估大语言模型 / SparseEval: Efficient Evaluation of Large Language Models by Sparse Optimization
1️⃣ 一句话总结
这篇论文提出了一种名为SparseEval的新方法,通过将大语言模型评估问题转化为一个稀疏优化问题,并利用梯度下降和迭代策略来智能选取少量代表性测试样本,从而在保证评估准确性的同时,大幅降低了评估所需的计算成本。