arXiv ID:
2604.05460
arXiv 提交日期: 2026-04-07
作为张量补全的大语言模型评估:低秩结构与半参数效率 / LLM Evaluation as Tensor Completion: Low Rank Structure and Semiparametric Efficiency
1️⃣ 一句话总结
这篇论文提出了一种新的理论框架,将大语言模型评估中基于两两比较的、稀疏且嘈杂的排名数据,建模为一个低秩张量补全问题,并设计了高效的统计方法来量化评估结果的不确定性。