arXiv ID:
2602.19333
arXiv 提交日期: 2026-02-22
PerSoMed:一个用于波斯语社交媒体文本分类的大规模平衡数据集 / PerSoMed: A Large-Scale Balanced Dataset for Persian Social Media Text Classification
1️⃣ 一句话总结
这项研究创建了首个大规模且类别均衡的波斯语社交媒体文本分类数据集,并通过实验证明,基于Transformer的先进模型在该数据集上能取得优异的分类效果,为波斯语自然语言处理研究提供了重要的数据基础和性能基准。