arXiv最新AI论文速览速学

🔍

标签: #image editing ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: ServImage: An Image Generation and Editing Benchmark from Real-world Commercial Imaging Services 04-28

arXiv ID: 2603.03657

arXiv 提交日期: 2026-03-04

multi-modal model evaluation benchmark image editing logical reasoning evaluation benchmark multimodal models dynamic processes

InEdit-Bench：用于智能图像编辑模型的中间逻辑路径基准测试 / InEdit-Bench: Benchmarking Intermediate Logical Pathways for Intelligent Image Editing Models

1️⃣ 一句话总结

这篇论文提出了首个用于评估图像编辑模型在复杂多步骤任务中动态推理能力的基准测试工具InEdit-Bench，发现当前主流模型在此方面存在普遍不足，旨在推动开发更具逻辑理解和推理能力的智能图像生成模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22625

arXiv 提交日期: 2026-02-26

computer vision model training systems differentiable rendering bitmap optimization gpu acceleration neural graphics image editing

DiffBMP：基于位图图元的可微分渲染 / DiffBMP: Differentiable Rendering with Bitmap Primitives

1️⃣ 一句话总结

这篇论文提出了一个名为DiffBMP的高效可微分渲染引擎，它能够直接对数千个位图图像（而非仅限于矢量图）的位置、颜色等属性进行快速优化，并集成了多种技术来提升优化效果，旨在无缝融入创意设计工作流程。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16149

arXiv 提交日期: 2026-02-18

computer vision model evaluation multi-modal demographic bias image editing fairness evaluation vision-language models identity preservation

评估图像到图像人像编辑中的人口统计学误表征 / Evaluating Demographic Misrepresentation in Image-to-Image Portrait Editing

1️⃣ 一句话总结

这篇论文研究发现，当前流行的图像编辑AI工具在处理不同种族、性别和年龄的人像时，会系统性地出现编辑效果减弱或强加刻板印象的偏见问题，并提出了一个无需修改模型即可显著减少对少数群体偏见的简单解决方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03826

arXiv 提交日期: 2026-02-03

computer vision model training aigc diffusion models image editing video editing guidance scale continuous control

通过自适应原点引导实现对编辑模型的连续控制 / Continuous Control of Editing Models via Adaptive-Origin Guidance

1️⃣ 一句话总结

这篇论文提出了一种名为AdaOr的新方法，它能让用户像调节音量一样平滑地控制AI对图片或视频的编辑强度，解决了现有模型要么不改、要么全改的‘跳跃式’编辑问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.16125

arXiv 提交日期: 2026-01-22

multi-modal benchmark model evaluation composed image retrieval image editing multimodal embedding evaluation benchmark fine-grained categorization

重新思考组合图像检索评估：一个源自图像编辑的细粒度基准 / Rethinking Composed Image Retrieval Evaluation: A Fine-Grained Benchmark from Image Editing

1️⃣ 一句话总结

这篇论文通过利用图像编辑技术构建了一个名为EDIR的、涵盖广泛类别和细粒度修改类型的新型组合图像检索基准，揭示了当前先进模型在该任务上存在显著能力缺陷，并指出了现有评估方法的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.10714

arXiv 提交日期: 2026-01-15

computer vision model training aigc image editing diffusion models attribute manipulation identity preservation vision-language models

Alterbute：编辑图像中物体的内在属性 / Alterbute: Editing Intrinsic Attributes of Objects in Images

1️⃣ 一句话总结

这篇论文提出了一个名为Alterbute的新方法，它能够像修图一样精准地改变图片中某个物体的颜色、材质甚至形状，同时还能保持这个物体本身的‘身份’（比如一辆特定的汽车型号）和周围场景不变，效果比现有技术更好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.08881

arXiv 提交日期: 2026-01-12

model training multi-modal aigc mixture-of-experts image generation image editing task-aware routing diffusion transformers

TAG-MoE：面向统一生成模型的专家混合任务感知门控机制 / TAG-MoE: Task-Aware Gating for Unified Generative Mixture-of-Experts

1️⃣ 一句话总结

这篇论文提出了一种让专家混合模型能‘看懂任务’的新方法，通过给任务添加语义标签并引导模型内部路由与之对齐，有效解决了统一图像生成与编辑模型中不同任务相互干扰的问题，从而提升了生成效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.05124

arXiv 提交日期: 2026-01-08

multi-modal model training aigc in-context learning image generation image editing reasoning alignment reinforcement learning

Re-Align：基于结构化推理引导的对齐方法，用于上下文图像生成与编辑 / Re-Align: Structured Reasoning-guided Alignment for In-Context Image Generation and Editing

1️⃣ 一句话总结

这篇论文提出了一个名为Re-Align的统一框架，它通过一种结构化的推理方法，有效弥合了模型对图文指令的理解能力与图像生成能力之间的差距，从而在根据上下文（多图多文）提示进行图像生成和编辑的任务上取得了更好的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.22984

arXiv 提交日期: 2025-12-28

computer vision model training aigc face anonymization diffusion models image editing privacy inversion

逆向个性化 / Reverse Personalization

1️⃣ 一句话总结

这篇论文提出了一种新方法，能够在不依赖文本描述或针对特定人脸进行模型训练的情况下，直接对图像进行人脸匿名化处理，同时还能灵活控制保留或修改其他面部特征，在保护隐私和保持图像质量之间取得了更好的平衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.22323

arXiv 提交日期: 2025-12-26

computer vision model training aigc diffusion transformers selective editing image editing computational efficiency feature fusion

SpotEdit：扩散变换器中的选择性区域编辑 / SpotEdit: Selective Region Editing in Diffusion Transformers

1️⃣ 一句话总结

这篇论文提出了一个名为SpotEdit的无训练图像编辑框架，它通过智能识别并跳过图像中未修改区域的冗余计算，只对需要编辑的部分进行更新，从而在保持高质量编辑效果的同时，大幅提升了编辑效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.03657

1️⃣ 一句话总结

arXiv ID: 2602.22625

1️⃣ 一句话总结

arXiv ID: 2602.16149

1️⃣ 一句话总结

arXiv ID: 2602.03826

1️⃣ 一句话总结

arXiv ID: 2601.16125

1️⃣ 一句话总结

arXiv ID: 2601.10714

1️⃣ 一句话总结

arXiv ID: 2601.08881

1️⃣ 一句话总结

arXiv ID: 2601.05124

1️⃣ 一句话总结

arXiv ID: 2512.22984

1️⃣ 一句话总结

arXiv ID: 2512.22323

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.03657 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22625 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16149 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03826 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.16125 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.10714 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.08881 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.05124 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.22984 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.22323 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.03657

arXiv ID: 2602.22625

arXiv ID: 2602.16149

arXiv ID: 2602.03826

arXiv ID: 2601.16125

arXiv ID: 2601.10714

arXiv ID: 2601.08881

arXiv ID: 2601.05124

arXiv ID: 2512.22984

arXiv ID: 2512.22323