arXiv ID:
2605.03716
统一多模态视觉追踪与双专家混合模型 / Unified Multimodal Visual Tracking with Dual Mixture-of-Experts
1️⃣ 一句话总结
本文提出了一种名为OneTrackerV2的统一多模态视觉追踪框架,通过创新的双专家混合结构(DMoE)和元合并器,实现了对RGB及其他多种输入模态的端到端训练,在12个基准测试中取得最佳性能,且即使缺失部分模态仍能保持稳定追踪效果。