arXiv最新AI论文速览速学

🔍

标签: #diffusion models ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: RAZOR: Ratio-Aware Layer Editing for Targeted Unlearning in Vision Transformers and Diffusion Models 03-17

arXiv ID: 2602.12045

arXiv 提交日期: 2026-02-12

machine learning model training systems generative modeling crystal structure fourier transform diffusion models materials discovery

用于潜在晶体学扩散和生成建模的傅里叶变换器 / Fourier Transformers for Latent Crystallographic Diffusion and Generative Modeling

1️⃣ 一句话总结

这篇论文提出了一种在频率域（而非原子坐标）表示晶体结构的新方法，结合了变分自编码器和扩散模型，旨在更高效、更符合晶体周期性规律地生成包含大量原子的新型晶体材料。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11453

arXiv 提交日期: 2026-02-12

machine learning natural language processing data learning-to-rank diffusion models information retrieval generative modeling tabular data

从噪声到有序：通过去噪扩散进行排序学习 / From Noise to Order: Learning to Rank via Denoising Diffusion

1️⃣ 一句话总结

这篇论文提出了一种名为DiffusionRank的新方法，它利用去噪扩散生成模型来学习信息检索中的排序任务，相比传统判别式模型，该方法通过建模数据和标签的完整联合分布，能生成更鲁棒的排序结果，并在实验中取得了显著提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11545

arXiv 提交日期: 2026-02-12

medical computer vision multi-modal medical imaging image restoration diffusion models pet reconstruction multi-modality fusion

监督辅助的多模态融合扩散模型用于PET图像恢复 / Supervise-assisted Multi-modality Fusion Diffusion Model for PET Restoration

1️⃣ 一句话总结

这篇论文提出了一种结合磁共振图像辅助的扩散模型，通过创新的多模态特征融合和两阶段监督学习策略，有效解决了低剂量PET图像恢复中结构不一致和分布外数据不匹配的难题，显著提升了图像质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10933

arXiv 提交日期: 2026-02-11

multi-agents model training theory stochastic optimal control diffusion models compositional generation cooperative agents generative modeling

CMAD：基于随机最优控制的协同多智能体扩散模型 / CMAD: Cooperative Multi-Agent Diffusion via Stochastic Optimal Control

1️⃣ 一句话总结

这篇论文提出了一种新方法，将多个预训练扩散模型的组合生成问题，看作是一个需要协同合作的随机最优控制问题，让这些模型像智能体一样共同调整生成路径，以实现一个统一的生成目标，而不是简单地将它们的概率分布进行数学组合。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10630

arXiv 提交日期: 2026-02-11

computer vision model training aigc super-resolution diffusion models generative adversarial networks image restoration model distillation

消除变分自编码器以实现快速高分辨率生成式细节恢复 / Eliminating VAE for Fast and High-Resolution Generative Detail Restoration

1️⃣ 一句话总结

这篇论文提出了一种名为GenDR-Pix的新方法，通过移除传统扩散模型中耗时的变分自编码器模块，并采用多阶段对抗蒸馏等技术，实现了对高分辨率图像（如4K图片）的快速、高质量细节恢复，速度提升近3倍且内存占用大幅减少。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11146

arXiv 提交日期: 2026-02-11

model training computer vision multi-modal diffusion models reward modeling preference optimization latent space image alignment

超越基于视觉语言模型的奖励：扩散模型原生潜在奖励建模 / Beyond VLM-Based Rewards: Diffusion-Native Latent Reward Modeling

1️⃣ 一句话总结

这篇论文提出了一种名为DiNa-LRM的新方法，它直接在扩散模型的内部潜在空间中评估图像质量，从而以更低的计算成本实现了与主流视觉语言模型相当的图像偏好对齐效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.09708

arXiv 提交日期: 2026-02-10

machine learning model training theory diffusion models partial differential equations physics-informed machine learning spectral methods generative modeling

谱空间中的物理信息扩散模型 / Physics-informed diffusion models in spectral space

1️⃣ 一句话总结

这篇论文提出了一种新方法，将生成式扩散模型与物理知识相结合，通过在谱空间中进行降维和噪声控制，能够高效且准确地求解包含未知参数的偏微分方程，尤其擅长处理观测数据稀疏的正向和逆向问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.09781

arXiv 提交日期: 2026-02-10

medical model evaluation computer vision explainable ai diffusion models medical imaging faithfulness analysis mri synthesis

生成式医学扩散模型的可解释性：基于忠实度的MRI合成分析 / Explainability in Generative Medical Diffusion Models: A Faithfulness-Based Analysis on MRI Synthesis

1️⃣ 一句话总结

本研究通过一种基于忠实度的可解释性框架，分析了扩散模型在生成医学影像（如MRI）时的内部决策过程，发现增强型原型网络能提供最可靠的解释，从而提升了生成式AI在医疗应用中的透明度和可信度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08249

arXiv 提交日期: 2026-02-09

medical multi-modal model training diffusion models image reconstruction image synthesis multimodal imaging virtual inpainting

基于去噪扩散模型的多模态图像重建与合成的统一框架 / A Unified Framework for Multimodal Image Reconstruction and Synthesis using Denoising Diffusion Models

1️⃣ 一句话总结

这篇论文提出了一个名为Any2all的统一框架，它利用单个去噪扩散模型，通过将其视为一个虚拟的‘图像修复’问题，成功解决了多种多模态图像重建与合成任务，避免了为每个任务单独训练模型的繁琐，并在实验中取得了优异且感知质量更好的结果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08395

arXiv 提交日期: 2026-02-09

video model training computer vision video restoration diffusion models temporal alignment knowledge distillation adversarial training

D^2-VR：基于协同优化策略的、抗退化且经过蒸馏的视频修复方法 / D$^2$-VR: Degradation-Robust and Distilled Video Restoration with Synergistic Optimization Strategy

1️⃣ 一句话总结

这篇论文提出了一种名为D^2-VR的新方法，它通过设计抗退化的运动对齐模块和采用对抗性蒸馏技术，在保证视频修复高质量的同时，将处理速度大幅提升了12倍，有效解决了现有方法速度慢且面对复杂画面退化时效果不稳定的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.12045

1️⃣ 一句话总结

arXiv ID: 2602.11453

1️⃣ 一句话总结

arXiv ID: 2602.11545

1️⃣ 一句话总结

arXiv ID: 2602.10933

1️⃣ 一句话总结

arXiv ID: 2602.10630

1️⃣ 一句话总结

arXiv ID: 2602.11146

1️⃣ 一句话总结

arXiv ID: 2602.09708

1️⃣ 一句话总结

arXiv ID: 2602.09781

1️⃣ 一句话总结

arXiv ID: 2602.08249

1️⃣ 一句话总结

arXiv ID: 2602.08395

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.12045 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11453 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11545 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10933 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10630 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11146 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.09708 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.09781 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08249 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08395 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.12045

arXiv ID: 2602.11453

arXiv ID: 2602.11545

arXiv ID: 2602.10933

arXiv ID: 2602.10630

arXiv ID: 2602.11146

arXiv ID: 2602.09708

arXiv ID: 2602.09781

arXiv ID: 2602.08249

arXiv ID: 2602.08395