arXiv ID:
2606.06076
arXiv 提交日期: 2026-06-04
基于模态差距感知自蒸馏的符号状态视觉空间规划学习 / Learning Visual Spatial Planning from Symbolic State via Modality-Gap-Aware Self-Distillation
1️⃣ 一句话总结
这篇论文提出了一种名为MGSD的两阶段自蒸馏方法,通过先让视觉模型学习准确的物体状态表示,再让符号规划专家用“教师-学生”模式指导视觉模型进行多步推理,从而在不依赖符号输入的情况下,显著提升了视觉空间规划任务的表现。