论文信息
- 论文标题:《Image Inpainting for Irregular Holes Using Partial Convolutions》
- 论文链接:ECCV 2018 Open Access Repository
图像修复简介
图像修复(Image Inpainting),顾名思义,就是将图像中损坏的部分修复起来。该技术可以应用在图像编辑上,例如移除物体(remove unwanted object), 图像补全,修复老照片等。传统的图像修复方法有diffusion-based和patch-based两种,而近些年来的方法多数都是基于深度学习来做的。
data:image/s3,"s3://crabby-images/6e32f/6e32f53c14674f068e4820ac91149d3d89c3769f" alt=""
data:image/s3,"s3://crabby-images/d44e9/d44e9b1b609ea5013d9f483997000b5d0c84a255" alt=""
Partial Convolution详解
基于深度学习的图像修复方法在之前基本都是使用卷积神经网络(CNN)来做的,也就是将损坏图片作为输入,完整图片作为标签进行学习。而普通的卷积作用在图片的损坏区域时,大多数的计算都被浪费了,因为损坏区域的像素值为0。同时,卷积核在做计算时不能区分损坏和未损坏的区域,对两部分的信息差并不敏感。
在ECCV2018中,来自NVIDIA的Guilin Liu等人提出了Partial Convolution (PConv)。PConv通过加入mask掩码参与到卷积运算中,大大提升了运算效率,且将损坏与非损坏区域的像素区别开来,提升了其敏感性。
PConv运算
每一层PConv的运算可以用以下公式来表达:
data:image/s3,"s3://crabby-images/87a8d/87a8dd7baf3cc19989ec5b60bf42efc26e80b139" alt=""
data:image/s3,"s3://crabby-images/f2ffa/f2ffae069c9ce9b7358a95e2a1710e815f901175" alt=""
Mask更新
data:image/s3,"s3://crabby-images/b672c/b672c97afb58fdc2f85b51fa1e604eb3bd4c208e" alt=""
Padding填充
运算过程中还有一个细节:在进行部分卷积操作之前,需要对图像和Mask的边界进行值为0的填充,进行0的填充目的是为了修补的内容不受图像外部无效值的影响。
网络结构
- 网络的输入大小均为:image 512×512 mask 512×512
- 采用与《Globally and locally consistent image completion》相同的类似U-net的网络结构,将所有的卷积层替换为部分卷积层( partial convolutional layers ),同时在解码器中上采样使用 nearest neighbor up-sampling,同时采用Skips links连接编码器中的feature map。在最后一个部分卷积层将输入图像(带缺失部分)和网络生成的图像结合,将网络生成的图像非缺失部分全部替换为输入图像的非缺失部分。具体网络结构如下:
data:image/s3,"s3://crabby-images/8c8d3/8c8d3f15ad60b51f5dc2def6182be454d6126539" alt=""
data:image/s3,"s3://crabby-images/1c578/1c578a8f2a9ee9f668c1ddb8879cbda45beaa3a9" alt=""
参考资料
https://zhuanlan.zhihu.com/p/519446359
[1] Image Inpainting for Irregular Holes Using Partial Convolutions
[2] High-Fidelity Pluralistic Image Completion with Transformers
[3] Bringing Old Photos Back to Life
[4] 李文鑫:Partial Convolutions for Image Inpainting