arXiv ID:
2606.22905
arXiv 提交日期: 2026-06-22
交互式虚拟人:面向实时流式视频生成的一致性与意图感知虚拟人 / InteractiveAvatar: Real-Time Streaming Video Generation for Consistent and Intent-Aware Avatars
1️⃣ 一句话总结
本文提出了一种名为InteractiveAvatar的实时流式视频生成框架,通过自回归蒸馏实现无限时长生成,并引入长-短视觉记忆机制来保持画面连续性和一致性,同时借助推理-反应模块让虚拟人能够理解用户意图并做出相应的语音和动作回应,从而在复杂交互场景中生成既稳定又智能的虚拟形象。