第十三节 卷积神经网络识别手写数字

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data  # TensorFlow中提供的演示数据

"""
卷积神经网络重要概念:分为卷积层,激活,池化层,全连接层
    卷积层中的卷积核包含权重系数,而池化层不包含权重系数
    卷积层卷积过程:
        过滤器(观察窗口):
            组成:
                大小(奇数,1*1、3*3、5*5、13*13),移动步长,
            作用:
                通过观察窗口去扫描一张图片,不管是单通道还是3通道图片,一个过滤器最后只会返回一张图片
        零填充:当移动后超出图片大小,有两种解决方式,一种是直接越过放弃不能扫描的部分,二是对图片进行零填充到满足扫描
        案列:一张[28,30,3]的图片经过大小5*5、步长3、零填充4的n个过滤扫描后变成:[((28-5+2*4)/3)+1, ((30-窗口大小+2倍零填充的大小)/步长)+1, n]
    卷积神经的激活函数(Relu):f(x) = max(0, x),增加网格的非线性分割能力,相对于sigmoid函数,计算量小,而且sigmoid函数在反向传播的时候容易引起梯度爆炸 
    池化层(pooling):特征提取,去掉feature map 中不重要的样本,减少参数数量。pooling方法很多,常用的max pooling,max pooling方法用2*2步长2的窗口去扫描卷积后的图片,逐一取窗口内最大的数,每移动一次取一次,一张4*4的图片经过扫描以后就会变成2*2的图片,也会有零填充的需要,池化后的图片大小计算方式和上面的案例是一直的
"""

# 定义一个随机初始化权重函数
def weight_variables(shape):
    w = tf.Variable(tf.random_normal(shape=shape, mean=0.0, stddev=1.0))
    return w

# 定义一个随机初始化偏置函数
def bias_variables(shape):
    b = tf.Variable(tf.constant(0.0, shape=shape))
    return b

def model():
    """自定义卷积模型"""
    # 1.建立数据的占位符 特征值X [None, 784]  目标值y_true [None, 10]
    with tf.variable_scope("data"):
        # None代表不确定的样本数
        x = tf.placeholder(tf.float32, [None, 784])
        y_true = tf.placeholder(tf.float32, [None, 10])

    # 第一个卷积层,卷积:5*5*1,32个,strides=1,激活:tf.nn.relu  池化
    with tf.variable_scope("conv1"):
        # 随机初始化权重1是输入通道,32是输出通道,偏置[32]
        w_conv1 = weight_variables([5, 5, 1, 32])
        b_conv1 = bias_variables([32])

        # 对x进行形状改变[None, 784] ==> [None, 28, 28, 1]
        x_reshape = tf.reshape(x, [-1, 28, 28, 1])

        '''卷积层API
            tf.nn.conv2d(input, filter=, strides=,padding=,name=,)
                input:给定的输入张量,具有[batch, height, width, channel],类型为float32,64
                filter:指定过滤器大小,[filter_height, filter_width, in_channel, out_channels]
                strides:步长,[1, stride, stride, 1]
                padding:SAME或者VALID,VALID表示超出部分舍弃,SAME表示填充,使得变化后的height和weight一样大
        '''
        # [None, 28, 28, 1] ==> [None, 28, 28, 32]
        x_relu1 = tf.nn.relu(tf.nn.conv2d(x_reshape, w_conv1, strides=[1, 1, 1, 1], padding="SAME") + b_conv1)

        # 池化 2*2,strides [None, 28, 28, 32]  ==> [None, 14, 14, 32],第一个参数[batch, height, width, channel],ksize池化窗口大小[1, ksize, ksize, 1],strides步长[1, stride, stride, 1],这里的padding跟卷积核的不一样,只是单纯的不够进行填充
        x_pool1 = tf.nn.max_pool(x_relu1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")

    # 第二个卷积层
    with tf.variable_scope("conv2"):
        # 随随机初始化变量,权重:[5, 5, 32, 64]
        w_conv2 = weight_variables([5, 5, 32, 64])
        b_conv2 = bias_variables([64])

        # 卷积,激活,池化
        # [None, 14, 14, 32]==>[None, 14, 14, 64]
        x_relu2 = tf.nn.relu(tf.nn.conv2d(x_pool1, w_conv2, strides=[1, 1, 1, 1], padding="SAME") + b_conv2)

        # 池化 2*2,strides [None, 14, 14, 64]  ==> [None, 7, 7, 64]
        x_pool2 = tf.nn.max_pool(x_relu2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding="SAME")

    # 全连接层,[None, 7, 7, 64]==>[None, 7*7*64]*[7*7*64, 10] + [10] = [None, 10]
    with tf.variable_scope(""):
        # 随机初始化权重
        w_fc = weight_variables([7*7*64, 10])
        b_fc = bias_variables([10])

        # 修改形状,[None, 7, 7, 64]==>[None, 7*7*64]
        x_fc_reshape = tf.reshape(x_pool2, [-1, 7*7*64])

        # 进行矩阵运算得出每个样本的10个结果
        y_predict = tf.matmul(x_fc_reshape, w_fc) + b_fc

        return x, y_true, y_predict
def con_vfc():
    # 获取真实数据
    mnist = input_data.read_data_sets("./mnist/input_data/", one_hot=True)

    # 定义模型,得出输出
    x, y_true, y_predict = model()

    # 3.求所有样本的损失,然后求损失
    with tf.variable_scope("soft_cross"):
        # 求平均交叉熵损失
        loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_true, logits=y_predict))

    # 4.梯度下降求损失
    with tf.variable_scope("optimizer"):
        # 0.1是学习率,minimize表示求最小损失
        train_op = tf.train.GradientDescentOptimizer(0.0001).minimize(loss)

    # 5.计算准确率,每一个样本对应每个特征值都有一个概率,tf.argmax(y_true, 1), tf.argmax(y_predict, 1)返回的是分别是真实值和预测值的正确的下标,equal判断两个下标是否一致,一样,则这个样本被标为1
    with tf.variable_scope("acc"):
        equal_list = tf.equal(tf.argmax(y_true, 1), tf.argmax(y_predict, 1))

        # equal_list None个样本 [1, 0, 1, 1, 0, 0.....]
        accuracy = tf.reduce_mean(tf.cast(equal_list, tf.float32))

    # 定义初始化变量op
    init_op = tf.global_variables_initializer()

    # 开启会话
    with tf.Session() as sess:
        # 初始化变量
        sess.run(init_op)
        for i in range(2000):
            # 取出真实存在的特征值和目标值,50表示50个样本作为一个批次
            mnist_x, mnist_y = mnist.train.next_batch(50)

            # 运行训练op
            sess.run(train_op, feed_dict={x: mnist_x, y_true: mnist_y})

            # feed_dict这里的参数是必须,但是没有实际意义
            print("训练第{}步,准确率:{}".format(i, sess.run(accuracy, feed_dict={x: mnist_x, y_true: mnist_y})))

if __name__ == "__main__":
    con_vfc()
原文地址:https://www.cnblogs.com/kogmaw/p/12602472.html