arXiv ID:
2601.08430
arXiv 提交日期: 2026-01-13
RubricHub:一个通过自动化从粗到细生成构建的全面且高区分度的评分标准数据集 / RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation
1️⃣ 一句话总结
这篇论文提出了一个自动化生成精细评分标准的框架,并据此创建了一个大规模数据集RubricHub,用于训练AI模型,使其在开放生成任务(如医疗问答)上的表现超越了包括GPT-5在内的前沿模型。