arXiv ID:
2512.17012
arXiv 提交日期: 2025-12-18
4D-RGPT:通过感知蒸馏实现区域级四维理解 / 4D-RGPT: Toward Region-level 4D Understanding via Perceptual Distillation
1️⃣ 一句话总结
这篇论文提出了一个名为4D-RGPT的新型多模态大模型,它通过一种创新的感知蒸馏训练方法,显著提升了AI对视频中三维结构和时间动态变化的区域级理解能力,并为此创建了一个专门的评测基准。