对空洞卷积的理解

tech2025-01-10  6

空洞卷积(dilated conv)

对空洞卷积的理解

今天听了一堂关于研究生科学素养的课,老师讲到,当代研究生很多人都只是有输入没有输出,随着时间的流逝,输入的知识也就淡忘了,所以提醒我们,在学习的过程中要有总结和记录,使用各种方法在头脑和电脑上面留下学过的印记,所以我以后都会花时间整理所学知识,相信这是个正确的学习方法。

产生的原因

空洞卷积最初的提出是为了解决图像分割的问题而提出的,常见的图像分割算法通常使用池化层和卷积层来增加感受野(Receptive Filed),同时也缩小了特征图尺寸(resolution),然后再利用上采样还原图像尺寸,特征图缩小再放大的过程造成了精度上的损失,因此需要一种操作可以在增加感受野的同时保持特征图的尺寸不变,从而代替下采样和上采样操作,在这种需求下,空洞卷积就诞生了。

概念

在普通卷积中间加上空白,就是空洞卷积,其中dilation表示空洞率,也就是卷积核之间的距离。卷积核之间的距离,也即白色方块的个数=dilation-1。灰色方块表示卷积核的权重,白色表示权重为0。 卷积过程如下图: 首先,解释,为什么说空洞卷积增大了感受野?

a是普通的卷积过程,卷积后的感受野为3。 b是dilation rate = 2的空洞卷积,卷积后的感受野为5。 c是dilation rate = 3的空洞卷积,卷积后的感受野为8。

所以说空洞卷积确实增大了卷积操作之后的感受野。 空洞卷积后的感受野计算公式:k=(n-1)* d - 1 其中,n为原卷积核大小,d为空洞率。

再来解释,为什么说空洞卷积没有改变图片尺寸? 因为卷积后图片的尺寸大小为

其中滤波器大小为(FH,FW),P为填充大小,S为步长。显然,输出图片大小与空洞率等无关,所以输出图片的尺寸不变。

优点

dilated的好处是不做pooling损失信息的情况下,加大了感受野,让每个卷积输出都包含较大范围的信息。

缺点

虽然空洞卷积增大了感受野,但是,由于空洞卷积的计算方式类似于棋盘格式,某一层得到的卷积结果,来自上一层的独立的集合,没有相互依赖,因此该层的卷积结果之间没有相关性,即局部信息丢失。

最新回复(0)