Pyramid Pooling Module (PPM)金字塔池化模型充分利用上下文信息

Pyramid scene parsing network. In Proc. CVPR, pages 2881–2890, 2017

目的:扩大感受野,尽可能的利用全局上下文信息(某种程度上,可以认为感受野大小可以认为是对上下文信息利用的程度)。

    做法:

        1.对骨干提取的feature map(channel =N)做池化得到特征金字塔

        2.然后通过1*1深度卷积降通道分别得到1*1,2*2,4*4,6*6的channel = 1/N的特征图

        3.对特征图进行双线性插值填充上采样到原Feature map尺寸

        4.与Feature map进行通道拼接(也叫级联)得到channel数增加1倍的特征图

        5.再利用1*1卷积核将上述拼接后的特征图 深度卷积降通道 得到与输入特征图Feature通道数一致的最终的语义分割预测结果

原文地址:https://www.cnblogs.com/Henry-ZHAO/p/12883579.html