arXiv ID:
2603.23172
arXiv 提交日期: 2026-03-24
从合成到原生:物流客服多语言意图分类的基准测试 / From Synthetic to Native: Benchmarking Multilingual Intent Classification in Logistics Customer Service
1️⃣ 一句话总结
这篇论文创建了一个基于真实物流客服对话的多语言意图分类公开基准,发现使用机器翻译的合成测试数据会高估模型在实际嘈杂用户查询中的性能,强调了使用真实数据进行评估的重要性。