Network in Network 个人理解

关键点是1*1的卷积是怎么用的,也就是MLP卷积。看如下的数据就可以理解了

输入为224*224*3的图像,第一层卷积为11*11*3*96(也就是96个11*11*3的卷积核,另外还有步长),卷积完后是54*54*96的数据,然后用1*1*96的卷积核进行卷积,得出54*54*96的数据,再利用1*1*96的卷积核进行卷积,得到54*54*96的数据,然后在用pooling。

原文地址:https://www.cnblogs.com/alexanderkun/p/6920660.html