arXiv ID:
2602.03107
arXiv 提交日期: 2026-02-03
文明的假面:大语言模型中文反讽式礼貌理解能力基准测试 / The Mask of Civility: Benchmarking Chinese Mock Politeness Comprehension in Large Language Models
1️⃣ 一句话总结
这项研究通过构建一个包含真实与模拟中文语料的数据集,系统评估了GPT-5.1、DeepSeek等六种主流大语言模型在识别中文礼貌、不礼貌及反讽式礼貌现象上的表现差异,为语言学理论与人工智能技术的跨学科融合提供了新思路。