03.TensorFlow逻辑回归

实验目的

1.掌握使用TensorFlow进行逻辑回归

2.掌握逻辑回归的原理

实验原理

逻辑回归是机器学习中很简答的一个例子，这篇文章就是要介绍如何使用tensorflow实现一个简单的逻辑回归算法。

逻辑回归可以看作只有一层网络的前向神经网络，并且参数连接的权重只是一个值，而非矩阵。公式为：y_predict=logistic(X*W+b)，其中X为输入，W为输入与隐含层之间的权重，b为隐含层神经元的偏置，而logistic为激活函数，一般为sigmoid或者tanh，y_predict为最终预测结果。

逻辑回归是一种分类器模型，需要函数不断的优化参数，这里目标函数为y_predict与真实标签Y之间的L2距离，使用随机梯度下降算法来更新权重和偏置。

实验环境

Linux Ubuntu 14.04

Python 3.6.0

Pycharm

TensorFlow

实验内容

使用TensorFlow进行逻辑回归操作。

实验步骤

编写tensorflow逻辑回归代码：

导入实验所需要的模块

导入实验所需的数据

设置训练参数

构造计算图，使用占位符placeholder函数构造变量x，y，代码如下：

Variable函数，设置模型的初始权重

构造逻辑回归模型

构造代价函数cost

使用梯度下降法求最小值，即最优解

初始化全部变量

使用tf.Session()创建Session会话对象，会话封装了Tensorflow运行时的状态和控制。

调用会话对象sess的run方法，运行计算图，即开始训练模型。

测试模型

评估模型的准确度。

完整代码：

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import os
os.environ["CUDA_VISIBLE_DEVICES"]="0"

mnist = input_data.read_data_sets("../案例/data",one_hot=True)
learning_rate = 0.01
training_epochs = 25
batch_size = 100
display_step = 1

x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])
W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
pred = tf.nn.softmax(tf.matmul(x,W)+b)
cost = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),reduction_indices=1))
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

init=tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(init)
    for epoch in range(training_epochs):
        avg_cost = 0
        total_batch = int(mnist.train.num_examples / batch_size)
        for i in range(total_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            _, c = sess.run([optimizer, cost], feed_dict={x: batch_xs, y: batch_ys})
            avg_cost += c / total_batch
        if (epoch+1) % display_step == 0:
            print("Epoch:", '%04d' % (epoch + 1), "Cost:" , "{:.09f}".format(avg_cost))
    correct_prediction = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
    print("Accuracy:", accuracy.eval({x: mnist.test.images[:3000], y: mnist.test.labels[:3000]}))

代码编写完毕运行结果为：