arXiv ID:
2604.01957
arXiv 提交日期: 2026-04-02
诊断翻译基准:对EU20基准套件的自动化质量保证研究 / Diagnosing Translated Benchmarks: An Automated Quality Assurance Study of the EU20 Benchmark Suite
1️⃣ 一句话总结
这篇论文通过一套自动化质量保证方法,系统地评估了机器翻译基准数据集的质量,发现翻译质量较低的基准数据集中包含更多错误,并发布了清洗后的数据集和工具,为大规模验证翻译可靠性提供了实用方案。