arXiv ID:
2603.21784
动态曝光连拍图像恢复 / Dynamic Exposure Burst Image Restoration
1️⃣ 一句话总结
这篇论文提出了一种名为DEBIR的新方法,它通过一个智能网络动态预测并设置每张连拍照片的最佳曝光时间,从而显著提升了从连拍照片中恢复出高质量图像的清晰度和效果。
动态曝光连拍图像恢复 / Dynamic Exposure Burst Image Restoration
这篇论文提出了一种名为DEBIR的新方法,它通过一个智能网络动态预测并设置每张连拍照片的最佳曝光时间,从而显著提升了从连拍照片中恢复出高质量图像的清晰度和效果。
用于图像重建与生成的语义一维分词器 / Semantic One-Dimensional Tokenizer for Image Reconstruction and Generation
这篇论文提出了一种名为SemTok的新型图像编码器,它能够将二维图像压缩成具有高级语义的一维符号序列,从而在图像重建和生成任务中实现更高效、更高质量的结果。
P-GSVC:用于可扩展图像与视频的分层渐进式二维高斯泼溅 / P-GSVC: Layered Progressive 2D Gaussian Splatting for Scalable Image and Video
这篇论文提出了一个名为P-GSVC的新框架,它通过将二维高斯元素组织成基础层和多个增强层,并采用联合训练策略,实现了图像和视频从粗糙到精细的高质量、可扩展重建,显著提升了重建效果。
GSNR:用于反问题的图平滑零空间表示 / GSNR: Graph Smooth Null-Space Representation for Inverse Problems
这篇论文提出了一种名为GSNR的新方法,通过利用图结构来约束成像反问题中不可观测的‘零空间’信号成分,从而在多种图像重建任务中显著提升了重建质量,效果优于现有主流方法。
ComptonUNet:一种在噪声和低统计量条件下利用康普顿相机定位伽马射线暴的深度学习模型 / ComptonUNet: A Deep Learning Model for GRB Localization with Compton Cameras under Noisy and Low-Statistic Conditions
这篇论文提出了一种名为ComptonUNet的新型深度学习模型,它能有效结合数据处理和图像重建,在光子信号微弱且背景噪声强烈的极端条件下,显著提升了对伽马射线暴这类宇宙高能爆发现象的定位精度。
基于去噪扩散模型的多模态图像重建与合成的统一框架 / A Unified Framework for Multimodal Image Reconstruction and Synthesis using Denoising Diffusion Models
这篇论文提出了一个名为Any2all的统一框架,它利用单个去噪扩散模型,通过将其视为一个虚拟的‘图像修复’问题,成功解决了多种多模态图像重建与合成任务,避免了为每个任务单独训练模型的繁琐,并在实验中取得了优异且感知质量更好的结果。
隐式神经表征促进统一的通用视觉编码 / Implicit Neural Representation Facilitates Unified Universal Vision Encoding
这篇论文提出了一种新型的视觉编码模型,它通过隐式神经表征技术,首次将图像识别和图像生成两大任务统一起来,学习到一个既可用于分类、检测等识别任务,又能用于高质量图像生成的紧凑嵌入空间。
视觉生成调优 / Visual Generation Tuning
这项研究提出了一种名为VGT的新方法,能够高效地激发现有视觉语言模型的视觉生成潜力,使其在图像重建和生成任务上取得优异表现,为构建下一代统一的多模态基础模型开辟了新途径。
图像块坍缩 / The Collapse of Patches
这篇论文提出了一种名为‘图像块坍缩’的新视角,通过分析图像中不同区域之间的相互依赖关系来确定一个最优的观察顺序,从而让计算机在只看到部分图像的情况下就能高效地完成图像生成和识别任务。
请先 登录 后再提交论文