arXiv ID:
2602.19991
arXiv 提交日期: 2026-02-23
跨语言套娃表示学习:跨越语音与文本 / Cross-lingual Matryoshka Representation Learning across Speech and Text
1️⃣ 一句话总结
这项研究开发了一种创新的双语语音-文本嵌入模型,让使用者能用沃洛夫语(一种主要靠口语传播的语言)的语音直接检索法语文本信息,绕过了传统上昂贵且复杂的语音识别和翻译步骤,为资源匮乏的语言群体打破了信息和模态的双重壁垒。