第十三节卷积神经网络识别手写数字

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data  # TensorFlow中提供的演示数据

"""
卷积神经网络重要概念：分为卷积层，激活，池化层，全连接层
    卷积层中的卷积核包含权重系数，而池化层不包含权重系数
    卷积层卷积过程：
        过滤器（观察窗口）：
            组成：
                大小（奇数，1*1、3*3、5*5、13*13），移动步长，
            作用：
                通过观察窗口去扫描一张图片，不管是单通道还是3通道图片，一个过滤器最后只会返回一张图片
        零填充：当移动后超出图片大小，有两种解决方式，一种是直接越过放弃不能扫描的部分，二是对图片进行零填充到满足扫描
        案列：一张[28,30,3]的图片经过大小5*5、步长3、零填充4的n个过滤扫描后变成：[((28-5+2*4)/3)+1, ((30-窗口大小+2倍零填充的大小)/步长)+1, n]
    卷积神经的激活函数（Relu）：f(x) = max(0, x)，增加网格的非线性分割能力，相对于sigmoid函数，计算量小，而且sigmoid函数在反向传播的时候容易引起梯度爆炸 
    池化层（pooling）：特征提取，去掉feature map 中不重要的样本，减少参数数量。pooling方法很多，常用的max pooling，max pooling方法用2*2步长2的窗口去扫描卷积后的图片，逐一取窗口内最大的数，每移动一次取一次，一张4*4的图片经过扫描以后就会变成2*2的图片，也会有零填充的需要，池化后的图片大小计算方式和上面的案例是一直的
"""

# 定义一个随机初始化权重函数
def weight_variables(shape):
    w = tf.Variable(tf.random_normal(shape=shape, mean=0.0, stddev=1.0))
    return w

# 定义一个随机初始化偏置函数
def bias_variables(shape):
    b = tf.Variable(tf.constant(0.0, shape=shape))
    return b

def model():
    """自定义卷积模型"""
    # 1.建立数据的占位符 特征值X [None, 784]  目标值y_true [None, 10]
    with tf.variable_scope("data"):
        # None代表不确定的样本数
        x = tf.placeholder(tf.float32, [None, 784])
        y_true = tf.placeholder(tf.float32, [None, 10])

    # 第一个卷积层，卷积：5*5*1,32个，strides=1，激活：tf.nn.relu  池化
    with tf.variable_scope("conv1"):
        # 随机初始化权重1是输入通道，32是输出通道，偏置[32]
        w_conv1 = weight_variables([5, 5, 1, 32])
        b_conv1 = bias_variables([32])

        # 对x进行形状改变[None, 784] ==> [None, 28, 28, 1]
        x_reshape = tf.reshape(x, [-1, 28, 28, 1])

        '''卷积层API
            tf.nn.conv2d(input, filter=, strides=,padding=,name=,)
                input：给定的输入张量，具有[batch, height, width, channel]，类型为float32,64
                filter：指定过滤器大小，[filter_height, filter_width, in_channel, out_channels]
                strides：步长，[1, stride, stride, 1]
                padding：SAME或者VALID，VALID表示超出部分舍弃，SAME表示填充，使得变化后的height和weight一样大
        '''
        # [None, 28, 28, 1] ==> [None, 28, 28, 32]
        x_relu1 = tf.nn.relu(tf.nn.conv2d(x_reshape, w_conv1, strides=[1, 1, 1, 1], padding="SAME") + b_conv1)

        # 池化 2*2，strides [None, 28, 28, 32]  ==> [None, 14, 14, 32]，第一个参数[batch, height, width, channel]，ksize池化窗口大小[1, ksize, ksize, 1]，strides步长[1, stride, stride, 1]，这里的padding跟卷积核的不一样，只是单纯的不够进行填充
        x_pool1 = tf.nn.max_pool(x_relu1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")

    # 第二个卷积层
    with tf.variable_scope("conv2"):
        # 随随机初始化变量，权重：[5, 5, 32, 64]
        w_conv2 = weight_variables([5, 5, 32, 64])
        b_conv2 = bias_variables([64])

        # 卷积，激活，池化
        # [None, 14, 14, 32]==>[None, 14, 14, 64]
        x_relu2 = tf.nn.relu(tf.nn.conv2d(x_pool1, w_conv2, strides=[1, 1, 1, 1], padding="SAME") + b_conv2)

        # 池化 2*2，strides [None, 14, 14, 64]  ==> [None, 7, 7, 64]
        x_pool2 = tf.nn.max_pool(x_relu2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")

    # 全连接层，[None, 7, 7, 64]==>[None, 7*7*64]*[7*7*64, 10] + [10] = [None, 10]
    with tf.variable_scope(""):
        # 随机初始化权重
        w_fc = weight_variables([7*7*64, 10])
        b_fc = bias_variables([10])

        # 修改形状，[None, 7, 7, 64]==>[None, 7*7*64]
        x_fc_reshape = tf.reshape(x_pool2, [-1, 7*7*64])

        # 进行矩阵运算得出每个样本的10个结果
        y_predict = tf.matmul(x_fc_reshape, w_fc) + b_fc

        return x, y_true, y_predict
def con_vfc():
    # 获取真实数据
    mnist = input_data.read_data_sets("./mnist/input_data/", one_hot=True)

    # 定义模型，得出输出
    x, y_true, y_predict = model()

    # 3.求所有样本的损失，然后求损失
    with tf.variable_scope("soft_cross"):
        # 求平均交叉熵损失
        loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_true, logits=y_predict))

    # 4.梯度下降求损失
    with tf.variable_scope("optimizer"):
        # 0.1是学习率，minimize表示求最小损失
        train_op = tf.train.GradientDescentOptimizer(0.0001).minimize(loss)

    # 5.计算准确率，每一个样本对应每个特征值都有一个概率，tf.argmax(y_true, 1), tf.argmax(y_predict, 1)返回的是分别是真实值和预测值的正确的下标，equal判断两个下标是否一致，一样，则这个样本被标为1
    with tf.variable_scope("acc"):
        equal_list = tf.equal(tf.argmax(y_true, 1), tf.argmax(y_predict, 1))

        # equal_list None个样本 [1, 0, 1, 1, 0, 0.....]
        accuracy = tf.reduce_mean(tf.cast(equal_list, tf.float32))

    # 定义初始化变量op
    init_op = tf.global_variables_initializer()

    # 开启会话
    with tf.Session() as sess:
        # 初始化变量
        sess.run(init_op)
        for i in range(2000):
            # 取出真实存在的特征值和目标值，50表示50个样本作为一个批次
            mnist_x, mnist_y = mnist.train.next_batch(50)

            # 运行训练op
            sess.run(train_op, feed_dict={x: mnist_x, y_true: mnist_y})

            # feed_dict这里的参数是必须，但是没有实际意义
            print("训练第{}步，准确率：{}".format(i, sess.run(accuracy, feed_dict={x: mnist_x, y_true: mnist_y})))

if __name__ == "__main__":
    con_vfc()
第十三节 卷积神经网络识别手写数字

第十三节卷积神经网络识别手写数字