最近阅读文献碰到了感受野,但是详细的一直没有深入理解,这里记录一下。
定义
感受野用来表示网络内部的不同神经元对原图像的感受范围的大小。换句话说,就是Feature Map一个像素映射到原始图像上所对应的范围。
- 神经元感受野的值越大表示其能接触到的原始图像范围就越大,也意味着它可能蕴含更为全局,语义层次更高的特征;
- 神经元感受野的值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用来大致判断每一层的抽象层次。
对应到姿态估计就可以利用感受野来控制不同分辨率的特征。
计算
感受野可以通过下图更形象的理解。

- Raw Image是原始图像;
- 用
kerneal_size = 3*3,stride = 2的卷积核扫过得到conv1,故conv1中一个像素映射到原始图像是3*3; - conv2中一个像素对应conv1
2*2,映射回原始图像为5*5

上图则更加直观的看出了感受野的大小变花,感受野与卷积核尺寸、步长都有关系。
下面给出计算公式:
其中,rn表示第n层的接受野;Si表示第i层的步长