arXiv ID:
2601.13253
arXiv 提交日期: 2026-01-19
一种面向低资源语言的大规模语义数据集生成混合协议:以土耳其语语义关系语料库为例 / A Hybrid Protocol for Large-Scale Semantic Dataset Generation in Low-Resource Languages: The Turkish Semantic Relations Corpus
1️⃣ 一句话总结
这篇论文提出了一种低成本、可扩展的混合方法,成功构建了土耳其语的大规模语义关系数据集,有效解决了低资源语言在自然语言处理中面临的数据稀缺问题。