arXiv ID:
2603.24327
arXiv 提交日期: 2026-03-25
Le MuMo JEPA:一种使用可学习融合令牌的多模态自监督表示学习框架 / Le MuMo JEPA: Multi-Modal Self-Supervised Representation Learning with Learnable Fusion Tokens
1️⃣ 一句话总结
这篇论文提出了一种名为Le MuMo JEPA的新型自监督学习框架,它通过引入可学习的‘融合令牌’来高效整合图像和激光雷达深度等多模态数据,从而在自动驾驶等任务中,以更低的计算成本学习到性能更强的统一特征表示。