arXiv ID:
2512.20615
arXiv 提交日期: 2025-12-23
从被动动画到主动智能:通过在线推理与认知架构实现长视野交互式视频化身 / Active Intelligence in Video Avatars via Closed-loop World Modeling
1️⃣ 一句话总结
本文提出了首个旨在为视频化身赋予主动智能的ORCA框架,通过闭环OTAR推理循环和分层双系统架构,解决了现有方法在随机生成环境中缺乏自主长期目标规划能力的问题,并为此类任务建立了首个标准化评估基准L-IVA。