arXiv ID:
2509.09990
arXiv 提交日期: 2025-09-12
CMHG:中国少数民族语言标题生成数据集与基准 / CMHG: A Dataset and Benchmark for Headline Generation of Minority Languages in China
1️⃣ 一句话总结
该研究创建了一个专门用于中国少数民族语言(如藏语、维吾尔语和蒙古语)标题生成任务的数据集和评估基准,以解决因文字系统差异导致的数据稀缺问题。