CS231n课程笔记---卷积和池化

原博客：https://blog.csdn.net/dawningblue/article/details/82902336

用不是特别严谨但是比较通俗的语言描述整个过程

卷积神经网络是从卷积层开始介绍的，而卷积层的介绍是从全连接层开始介绍的。

全连接层的处理方式是一次性处理一张图片的全部信息，处理的方式是将图片信息和权重矩阵做乘积，得到一个评分结果。

在细节层面上：

我们会把一张图的全部信息拉成一个一维的向量，一张图的全部信息原始的状态像一个长方体（32x32x3）权重矩阵和这个图片信息的矩阵乘法，本质上来说其实是一次性进行多个点积运算，因为你可以把权重的每一行想象成某一类图像的典型特征，本质上，没有什么矩阵乘法只有点积，或者一次性多个批量的点积，点积才是能说出意义的操作。

最后得到一个评分结果是一个向量，这个向量的纬度和图像的类别数一样，而每一个分量代表这个图片在这个类别上的评分，如果评分越高，那么图片属于这个类别的可能性就越大。于是就有了softmax回归，softmax的本质是在线性回归的基础上，进行了归一化处理，从评分变成了可能性（概率），看起来更直观。

本质上来说，全连接层的提取特征是整体一次性，而卷积层的特征提取是一点一点的提取。

卷积层的处理方法，在最核心的数学处理方面是没有本质不同的，需要借助“点积”这个数学工具，但是整个处理流程上改进了许多。

首先全连接层对图像是整体处理，而卷积是局部多次处理。它背后的深意其实是一开始我们认为图片的特征信息可以一次性就全部提取出来，变为我们认为需要将特征进行分割和组合，经过多次粗到细化才能提取出来的。

具体做法是，我们把之前整个大W变为一个一个小的w, 让每一个小的w和图片上的每一个区域都进行匹配测试（匹配的方式就是用点积），并把匹配的经过进行记录到一个矩阵中去（这些小的权重，通俗而不是专业一点的说法叫做“过滤器（filter），还有一个更加专业的说法称之为卷积核）之后再拿一个小的w和图片上的每个区域都进行了匹配测试又得到一个矩阵，就这么反反复复（不断训练），得到最优化的权重矩阵。

之后这些矩阵经过激活函数的处理ReLU,处理结果应该还是一个矩阵。

知识点

知识点1：图片是存储信息的形象表达

1. 矩阵表示

　典型的灰度图

2. 向量表示