arXiv ID:
2604.24665
arXiv 提交日期: 2026-04-27
土耳其语中来源敏感推理的基准测试:证据信任操纵下的人类与大型语言模型 / Benchmarking Source-Sensitive Reasoning in Turkish: Humans and LLMs under Evidential Trust Manipulation
1️⃣ 一句话总结
本研究通过实验发现,土耳其语母语者会根据信息来源的可信度,在两种过去时态后缀(-DI和-mIs)之间做出不同选择,而大型语言模型(LLM)在这类基于证据信任的推理中表现不稳定,与人类存在明显差距。