arXiv ID:
2601.07632
GeoMotionGPT:基于大语言模型的几何对齐运动理解框架 / GeoMotionGPT: Geometry-Aligned Motion Understanding with Large Language Models
1️⃣ 一句话总结
这篇论文提出了一种新方法,通过强制运动代码本和大语言模型嵌入空间保持正交性,使两者共享统一的几何基础,从而显著提升模型对复杂运动的理解和推理能力,在HumanML3D数据集上性能超越了现有最佳方法20%。