最近阅读文献碰到了感受野,但是详细的一直没有深入理解,这里记录一下。

定义

感受野用来表示网络内部的不同神经元对原图像的感受范围的大小。换句话说,就是Feature Map一个像素映射到原始图像上所对应的范围。

  • 神经元感受野的值越大表示其能接触到的原始图像范围就越大,也意味着它可能蕴含更为全局,语义层次更高的特征;
  • 神经元感受野的值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用来大致判断每一层的抽象层次。

对应到姿态估计就可以利用感受野来控制不同分辨率的特征。

计算

感受野可以通过下图更形象的理解。

  • Raw Image是原始图像;
  • kerneal_size = 3*3stride = 2的卷积核扫过得到conv1,故conv1中一个像素映射到原始图像是3*3
  • conv2中一个像素对应conv12*2,映射回原始图像为5*5

上图则更加直观的看出了感受野的大小变花,感受野与卷积核尺寸、步长都有关系。

下面给出计算公式:

其中,rn表示第n层的接受野;Si表示第i层的步长