arXiv ID:
2603.19227
arXiv 提交日期: 2026-03-19
基于扩散的离散运动分词器:桥接语义与运动学条件 / Bridging Semantic and Kinematic Conditions with Diffusion-based Discrete Motion Tokenizer
1️⃣ 一句话总结
这篇论文提出了一个名为MoTok的三阶段框架,通过一种基于扩散的离散运动分词器,巧妙地将擅长语义控制的离散模型与擅长精细运动学控制的连续扩散模型结合起来,从而在生成人体运动时,既能理解高级语义指令,又能精确满足复杂的运动细节要求,显著提升了生成质量和控制能力。