arXiv ID:
2601.03666
arXiv 提交日期: 2026-01-07
E5-Omni:面向全模态嵌入的显式跨模态对齐方法 / e5-omni: Explicit Cross-modal Alignment for Omni-modal Embeddings
1️⃣ 一句话总结
这篇论文提出了一种名为e5-omni的轻量级方法,通过校准相似度尺度、优化训练样本难度和统一嵌入空间统计特性,有效解决了现有全模态嵌入模型中跨模态比较不准确、训练效率低的问题,显著提升了文本、图像、音频、视频等多种不同类型数据在同一个空间中进行匹配的鲁棒性和效果。