基于扩散模型的图像编辑：首篇综述

AIGC 大模型最火热的任务之一——基于 Diffusion Model 的图像编辑(editing)领域的首篇综述。长达 26 页，涵盖 297 篇文献！本文全面研究图像编辑前沿方法，并根据技术路线精炼地划分为 3 个大类、14 个子类，通过表格列明每个方法的类型、条件、可执行任务等信息。此外，本文提出了一个全新 benchmark 以及 LMM Score 指标来对代表性方法进行实验评估，为研究者提供了便捷的学习参考工具。强烈推荐 AIGC 大模型研究者或爱好者阅读，紧跟热点。

作者：Yi Huang, Jiancheng Huang, Yifan Liu, Mingfu Yan, Jiaxi Lv, Jianzhuang Liu, Wei Xiong, He Zhang, Liangliang Cao, Shifeng Chen
单位: 中科院、Adobe公司、苹果公司(曹亮亮等)、南科大
论文链接:https://arxiv.org/abs/2402.17525
Github 网址：https://github.com/SiatMMLab/Awesome-Diffusion-Model-Based-Image-Editing-Methods

摘要

去噪扩散模型已成为各种图像生成和编辑任务的有力工具，有助于以无条件或输入条件的方式合成视觉内容。这些模型背后的核心理念是学习如何逆转逐渐向图像中添加噪声的过程，从而从复杂的分布中生成高质量的样本。

在这份调查报告中，我们详尽概述了使用扩散模型进行图像编辑的现有方法，涵盖了该领域的理论和实践方面。我们从学习策略、用户输入条件和可完成的一系列具体编辑任务等多个角度对这些作品进行了深入分析和分类。此外，我们还特别关注图像的inpainting和outpainting，并探讨了早期的传统上下文驱动方法和当前的多模态条件方法，对其方法论进行了全面分析。

为了进一步评估文本引导图像编辑算法的性能，我们提出了一个系统基准 EditEval，其特点是采用了创新指标 LMM Score。最后，我们讨论了当前的局限性，并展望了未来研究的一些潜在方向。

附带的资源库发布在:https://github.com/SiatMMLab/Awesome-Diffusion-Model-Based-Image-Editing-Methods。