arXiv ID:
2602.20566
BFA++:面向多视角视觉语言动作模型的分层最佳特征感知令牌剪枝 / BFA++: Hierarchical Best-Feature-Aware Token Prune for Multi-View Vision Language Action Model
1️⃣ 一句话总结
本文提出了一种名为BFA++的动态令牌剪枝框架,它通过分层策略智能筛选多视角图像中的关键视觉信息,从而在显著提升机器人操作模型计算速度的同时,保持甚至提高了任务执行的成功率。