arXiv ID:
2606.22959
arXiv 提交日期: 2026-06-22
变分自编码器设计对基于扩散模型的手语生成中潜在姿态表征的影响 / The Impact of VAE Design on Latent Pose Representations for Diffusion-based Sign Language Production
1️⃣ 一句话总结
本文研究了在手语生成任务中,变分自编码器的结构和训练目标设计如何影响其潜在空间的性质,进而影响下游扩散模型的生成效果,并发现潜在空间的特性比单纯的重建精度更能解释生成质量的差异。