arXiv最新AI论文速览速学

🔍

标签: #visual consistency ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: InteractiveAvatar: Real-Time Streaming Video Generation for Consistent and Intent-Aware Avatars 06-23

arXiv ID: 2606.22905

arXiv 提交日期: 2026-06-22

video generation multi-modal agents real-time streaming avatar generation visual consistency intent-aware diffusion model

交互式虚拟人：面向实时流式视频生成的一致性与意图感知虚拟人 / InteractiveAvatar: Real-Time Streaming Video Generation for Consistent and Intent-Aware Avatars

1️⃣ 一句话总结

本文提出了一种名为InteractiveAvatar的实时流式视频生成框架，通过自回归蒸馏实现无限时长生成，并引入长-短视觉记忆机制来保持画面连续性和一致性，同时借助推理-反应模块让虚拟人能够理解用户意图并做出相应的语音和动作回应，从而在复杂交互场景中生成既稳定又智能的虚拟形象。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.25706

arXiv 提交日期: 2026-03-26

multi-modal model training aigc interleaved generation text-to-image planning visual consistency benchmark

万维编织者：通过解耦训练实现交错式多模态生成 / Wan-Weaver: Interleaved Multi-modal Generation via Decoupled Training

1️⃣ 一句话总结

这篇论文提出了一个名为Wan-Weaver的模型，它通过将复杂的图文交错生成任务分解为文本规划和视觉一致性建模两个独立步骤来训练，从而在没有真实交错数据的情况下，也能生成内容连贯、视觉一致的多模态混合内容。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.03540

arXiv 提交日期: 2025-12-03

computer vision multi-modal aigc text-to-image diffusion models procedural generation visual consistency instruction following

CookAnything：一个灵活且一致的用于多步骤菜谱图像生成的框架 / CookAnything: A Framework for Flexible and Consistent Multi-Step Recipe Image Generation

1️⃣ 一句话总结

这篇论文提出了一个名为CookAnything的新框架，它能够根据任意长度的文字菜谱指令，智能地生成一系列既连贯又步骤分明的烹饪过程图片，解决了现有AI模型在生成多步骤、结构化图像序列时面临的灵活性和一致性难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.04784

arXiv 提交日期: 2025-12-02

reinforcement learning model training aigc image generation reward modeling visual consistency pairwise evaluation rl optimization

PaCo-RL：通过成对奖励建模推进强化学习在一致性图像生成中的应用 / PaCo-RL: Advancing Reinforcement Learning for Consistent Image Generation with Pairwise Reward Modeling

1️⃣ 一句话总结

这篇论文提出了一个名为PaCo-RL的新框架，它通过一个专门评估图像一致性的奖励模型和一个高效的强化学习算法，让AI模型能够更稳定、更高效地生成在角色、风格和逻辑上保持连贯的多张图像，比如用于故事叙述或角色设计。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.22905

1️⃣ 一句话总结

arXiv ID: 2603.25706

1️⃣ 一句话总结

arXiv ID: 2512.03540

1️⃣ 一句话总结

arXiv ID: 2512.04784

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.22905 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.25706 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.03540 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.04784 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.22905

arXiv ID: 2603.25706

arXiv ID: 2512.03540

arXiv ID: 2512.04784