arXiv ID:
2604.27137
arXiv 提交日期: 2026-04-29
大语言模型中的跨语言回复一致性:基于ILR标准的六种语言Claude评估 / Cross-Lingual Response Consistency in Large Language Models: An ILR-Informed Evaluation of Claude Across Six Languages
1️⃣ 一句话总结
本文基于跨机构语言圆桌(ILR)技能描述框架,系统评估了Claude模型在六种语言(英语、法语、罗马尼亚语、西班牙语、意大利语和德语)上的回复一致性,发现不同语言在回复长度、创意表达、礼貌策略、技术术语和文化校准等方面存在显著且系统性的差异,表明跨语言输出变化是可解释的、分领域的,并对公平的多语言AI部署具有重要影响。