BlurDM:一种用于图像去模糊的模糊扩散模型 / BlurDM: A Blur Diffusion Model for Image Deblurring
1️⃣ 一句话总结
这篇论文提出了一种名为BlurDM的新模型,它巧妙地将图像模糊的形成过程融入到扩散模型中,通过同时去噪和去模糊的方式,有效提升了现有图像去模糊方法的性能。
请先 登录 后再提交论文
BlurDM:一种用于图像去模糊的模糊扩散模型 / BlurDM: A Blur Diffusion Model for Image Deblurring
这篇论文提出了一种名为BlurDM的新模型,它巧妙地将图像模糊的形成过程融入到扩散模型中,通过同时去噪和去模糊的方式,有效提升了现有图像去模糊方法的性能。
神经重制:用于结构对齐生成的相位保持扩散模型 / NeuralRemaster: Phase-Preserving Diffusion for Structure-Aligned Generation
这篇论文提出了一种新的扩散模型方法,它在生成新图像或视频时能保持原始输入的空间结构(如物体形状和位置),从而在图像重渲染、模拟器增强等需要几何一致性的任务上表现更优,且无需增加额外计算成本。
实时数字人:支持无限时长流式生成、由实时音频驱动的数字人生成 / Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length
这篇论文提出了一个名为Live Avatar的软硬件协同设计框架,它通过创新的并行计算和缓存机制,首次实现了使用超大规模扩散模型进行高保真、低延迟、无限时长的实时数字人视频流式生成。
CookAnything:一个灵活且一致的用于多步骤菜谱图像生成的框架 / CookAnything: A Framework for Flexible and Consistent Multi-Step Recipe Image Generation
这篇论文提出了一个名为CookAnything的新框架,它能够根据任意长度的文字菜谱指令,智能地生成一系列既连贯又步骤分明的烹饪过程图片,解决了现有AI模型在生成多步骤、结构化图像序列时面临的灵活性和一致性难题。
MagicQuillV2:基于分层视觉提示的精确交互式图像编辑 / MagicQuillV2: Precise and Interactive Image Editing with Layered Visual Cues
这篇论文提出了一个名为MagicQuillV2的新系统,它通过将图像编辑意图分解为内容、位置、结构和颜色等多个可独立控制的分层视觉提示,从而让用户能像使用传统图形软件一样,对AI生成过程进行更直观和精细的控制。
基于上下文同步LoRA的人像视频编辑 / In-Context Sync-LoRA for Portrait Video Editing
这篇论文提出了一种名为Sync-LoRA的新方法,它通过使用少量经过严格筛选的同步人像视频进行训练,能够在对人像视频进行外观、表情或背景等多样化编辑的同时,精确保持原始视频中人物的动作轨迹和身份一致性。
POLARIS:用于扩散模型中鲁棒自适应反演的投影正交最小二乘法 / POLARIS: Projection-Orthogonal Least Squares for Robust and Adaptive Inversion in Diffusion Models
这篇论文发现扩散模型在图像编辑中效果变差的关键原因在于噪声近似误差的累积,并提出了一种名为POLARIS的简单高效方法,通过动态调整一个关键参数来从根源上最小化每一步的误差,从而显著提升图像重建和后续编辑任务的质量。
Glance:用1个样本加速扩散模型 / Glance: Accelerating Diffusion Models with 1 Sample
这篇论文提出了一种名为Glance的智能加速方法,它通过为扩散模型的不同生成阶段配备两个轻量级的LoRA适配器(一个用于慢速的语义阶段,一个用于快速的重构阶段),仅需1个样本、1小时即可完成训练,就能实现高达5倍的推理加速,同时保持良好的图像质量和泛化能力。
OmniRefiner:基于强化学习的局部扩散模型图像精细化方法 / OmniRefiner: Reinforcement-Guided Local Diffusion Refinement
这篇论文提出了一个名为OmniRefiner的两阶段图像精细化框架,它通过结合扩散模型和强化学习,有效解决了现有方法在根据参考图编辑生成图像时难以保留精细纹理和保持视觉一致性的问题。
Fast3Dcache:无需训练的3D几何合成加速方法 / Fast3Dcache: Training-free 3D Geometry Synthesis Acceleration
本文提出了一种名为Fast3Dcache的新方法,它能在不重新训练模型的前提下,通过智能地复用计算过程中稳定的中间结果,显著加快3D模型的生成速度,同时有效避免了因直接套用2D加速技术而导致的3D几何结构变形问题。