给定维数MxNxC
的特征图(例如,来自 Faster-RCNN 的预测感兴趣区域的输出(,如何减少要1x1xC
的空间维度? 即将特征图简化为向量状量,总结区域的特征?
我知道1x1
卷积,但这似乎与通道减少情况有关。平均值和最大池化也很常用,但是这些方法似乎更适合不太极端的子采样情况。
显然,人们可以简单地计算空间维度上的平均值,但这似乎相当粗糙。
我建议使用全局平均池化层。您有 MxNxC 功能图。每个特征图的全球平均池化计算平均值。因此,特征图变成了一个数字,特征图集变成了矢量。
我推荐这篇文章作为探索全球平均池化层的起点。
https://alexisbcook.github.io/2017/global-average-pooling-layers-for-object-localization/