arXiv ID:
2602.11795
arXiv 提交日期: 2026-02-12
基于子词嵌入的卢森堡语用户评论变体检测方法 / A Subword Embedding Approach for Variation Detection in Luxembourgish User Comments
1️⃣ 一句话总结
这篇论文提出了一种无需预先标准化或变体词表的子词嵌入方法,通过分析原始文本中的拼写和形态变化来揭示卢森堡语用户评论中的系统性语言变体,为多语言和小语种的语言多样性研究提供了一个可复现的框架。