arXiv ID:
2605.06276
arXiv 提交日期: 2026-05-07
面向低资源口语方言的线性语义分割方法 / Linear Semantic Segmentation for Low-Resource Spoken Dialects
1️⃣ 一句话总结
针对现有语义分割模型在低资源口语方言(如阿拉伯方言)中性能下降的问题,本文构建了一个覆盖日常对话、多语切换播客等场景的多体裁基准数据集(超过1000个样本),并提出一种专注于局部语义连贯性和应对话语中断的分割模型,在多种非新闻方言体裁上显著优于传统方法,且该方法可推广至其他低资源口语语言。