arXiv ID:
2512.07168
arXiv 提交日期: 2025-12-08
JEPA作为神经分词器:利用密度自适应注意力学习鲁棒的语音表征 / JEPA as a Neural Tokenizer: Learning Robust Speech Representations with Density Adaptive Attention
1️⃣ 一句话总结
这篇论文提出了一种两阶段自监督学习框架,它结合了联合嵌入预测架构和一种密度自适应注意力机制,能够从语音中高效提取出高度压缩、易于语言模型处理且能高质量还原成声音的语义特征单元。