arXiv ID:
2606.22806
策略即数据:从物理仿真中学习可泛化的人-物交互扩散模型 / Policy-as-Data: Learning Generalizable HOI Diffusion Models from Simulated Physics
1️⃣ 一句话总结
本文提出了一种新方法,通过物理仿真器中的强化学习策略生成大量高质量的人-物交互数据,并训练扩散模型,从而解决了真实数据稀缺导致的泛化性差和物理不一致问题,使生成的交互动作能适应新物体并保持长期真实感。