arXiv ID:
2510.20780
arXiv 提交日期: 2025-10-23
大型推理模型是好的翻译评估者吗?分析与性能提升 / Are Large Reasoning Models Good Translation Evaluators? Analysis and Performance Boost
1️⃣ 一句话总结
这篇论文发现大型推理模型在评估机器翻译质量时存在过度思考和评分不准的问题,并提出通过训练模型学习人类思考轨迹的方法,显著提升了评估效率与准确性。