arXiv最新AI论文速览速学

🔍

标签: #diffusion models ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: DuET: Dual Expert Trajectories for Diffusion Image Editing 06-12

arXiv ID: 2606.13303

arXiv 提交日期: 2026-06-11

computer vision aigc diffusion models image editing inference method text-to-image edit fidelity

DuET：用于扩散图像编辑的双专家轨迹 / DuET: Dual Expert Trajectories for Diffusion Image Editing

1️⃣ 一句话总结

本文提出了一种无需重新训练的推理方法DuET，通过在编辑过程中暂时放松对源图像的依赖、引入文本到图像的生成阶段，有效提升了扩散模型在复杂场景下的编辑质量和语义一致性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.13451

arXiv 提交日期: 2026-06-11

machine learning aigc model evaluation diffusion models uncertainty estimation molecular generation laplace approximation sample quality

分子扩散模型的不确定性估计 / Uncertainty Estimation for Molecular Diffusion Models

1️⃣ 一句话总结

本文提出了一种事后方法，通过分析扩散模型在分子生成过程中的噪声预测变化，来估计每个生成分子的质量可信度，从而帮助自动过滤低质量样本，提升模型的整体生成效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.13426

arXiv 提交日期: 2026-06-11

llm model training speculative decoding diffusion models block verification inference acceleration self-speculative

通过区块验证加速推测性扩散 / Accelerating Speculative Diffusions via Block Verification

1️⃣ 一句话总结

本文针对扩散模型提出了一种新的推测性采样机制，通过借鉴大语言模型中的区块验证方法，显著提高了草稿的接受率，并在此基础上引入无需额外训练的“自由草稿器”，在不增加计算负担的前提下实现了最高6.3%的速度提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.09816

arXiv 提交日期: 2026-06-08

machine learning computer vision diffusion models manifold learning forward process periodic terminal law point cloud

PTL-Diffusion：具有周期性终端定律的流形感知扩散模型 / PTL-Diffusion: Manifold-Aware Diffusion with Periodic Terminal Laws

1️⃣ 一句话总结

该论文提出了一种改进的扩散模型（PTL-Diffusion），它不再使用单一的随机噪声作为最终状态，而是让噪声过程收敛到一组周期性变化的分布上，从而让模型在生成数据时能更好地捕捉数据内部的结构（如流形和不同语义区域），在简单数据集上显著提升了生成质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.09516

arXiv 提交日期: 2026-06-08

computer vision video model evaluation video restoration real-time diffusion models attention mechanisms consumer gpu

SwiftVR：实时一步生成式视频修复 / SwiftVR: Real-Time One-Step Generative Video Restoration

1️⃣ 一句话总结

SwiftVR 提出了一种高效的实时视频修复框架，通过无掩码的滑动窗口自注意力机制和轻量级视频自编码器，在消费级GPU上首次实现了1080p分辨率下每秒26帧的实时流式处理，解决了高分辨率视频修复中计算量大、内存占用高的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.09273

arXiv 提交日期: 2026-06-08

computer vision machine learning 3d scene generation autonomous driving diffusion models semantic occupancy bird's eye view

EditSSC：利用无条件扩散模型实现可编辑的语义占用场景 / EditSSC: Toward Editable Semantic Occupancy Scenes with Unconditional Diffusion Models

1️⃣ 一句话总结

该论文提出了一种名为EditSSC的方法，通过将3D语义占用网格转化为2D鸟瞰图，并直接使用现成的Stable Diffusion模型进行扩散生成，在实现高质量的3D场景生成的同时，还能无需重新训练就支持草图引导、填充和扩边等多种编辑操作。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.06007

arXiv 提交日期: 2026-06-04

machine learning data model training diffusion models time series generation score matching sequential data adaptiveness

面向自适应时序数据生成的扩散模型 / Diffusion Models for Adaptive Sequential Data Generation

1️⃣ 一句话总结

本文提出了一种新方法，通过逐步添加和去除噪声，同时依赖已生成的数据来保证时序信息的连贯性，从而让扩散模型能够像真实世界一样按顺序生成时间序列数据，避免提前泄露未来信息，并在金融投资组合等任务中表现优异。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.04974

arXiv 提交日期: 2026-06-03

llm model evaluation diffusion models iterative decoding inference acceleration non-autoregressive generation scaffold tokens

SAID：通过支架感知迭代解码加速基于扩散的语言模型 / SAID: Accelerating Diffusion-Based Language Models via Scaffold-Aware Iterative Decoding

1️⃣ 一句话总结

本文提出了一种名为SAID的加速方法，通过优先对关键“支架”令牌进行去噪以构建文本的粗略结构，再快速填充可预测的细节令牌，从而在不牺牲生成质量的前提下，将扩散语言模型的推理速度提升多达9倍。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.02115

arXiv 提交日期: 2026-06-01

machine learning theory diffusion models drift estimation error bounds stochastic differential equations score matching

基于扩散模型的漂移估计器的误差界 / Error Bounds for a Diffusion Model-Based Drift Estimator

1️⃣ 一句话总结

本文为一种利用扩散模型从多条离散轨迹中估计随机微分方程漂移项的新方法提供了严格的理论误差分析，将总误差分解为离散化、去噪近似、噪声初始化和采样方差四个部分，并给出了显式的风险界。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.01670

arXiv 提交日期: 2026-06-01

machine learning recommendation diffusion models user preference temporal dynamics generative recommendation preference disentanglement

基于偏好解耦的时间感知扩散生成式推荐方法 / Time-Aware Diffusion based on Preference Disentanglement for Generative Recommendation

1️⃣ 一句话总结

本文提出一种名为TDPM的生成式推荐框架，通过将用户偏好分解为长期稳定的周期性偏好和短期事件触发的情境偏好，并让扩散过程根据时间动态调整对历史交互中不同项目的处理方式，从而显著提升推荐效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.13303

1️⃣ 一句话总结

arXiv ID: 2606.13451

1️⃣ 一句话总结

arXiv ID: 2606.13426

1️⃣ 一句话总结

arXiv ID: 2606.09816

1️⃣ 一句话总结

arXiv ID: 2606.09516

1️⃣ 一句话总结

arXiv ID: 2606.09273

1️⃣ 一句话总结

arXiv ID: 2606.06007

1️⃣ 一句话总结

arXiv ID: 2606.04974

1️⃣ 一句话总结

arXiv ID: 2606.02115

1️⃣ 一句话总结

arXiv ID: 2606.01670

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.13303 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.13451 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.13426 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.09816 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.09516 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.09273 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.06007 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.04974 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.02115 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.01670 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.13303

arXiv ID: 2606.13451

arXiv ID: 2606.13426

arXiv ID: 2606.09816

arXiv ID: 2606.09516

arXiv ID: 2606.09273

arXiv ID: 2606.06007

arXiv ID: 2606.04974

arXiv ID: 2606.02115

arXiv ID: 2606.01670