arXiv ID:
2604.24361
arXiv 提交日期: 2026-04-27
大型语言模型中的文化感知机器翻译:基准测试与探究 / Culture-Aware Machine Translation in Large Language Models: Benchmarking and Investigation
1️⃣ 一句话总结
本研究提出了一个专门用于评估机器翻译中文化感知能力的数据集CanMT和一套多维评价框架,通过系统测试多种大语言模型发现,模型在处理文化特有词汇时存在显著性能差异,且虽然能识别文化知识,但难以正确将其应用于翻译输出,而加入参考翻译能显著提升评估可靠性。