tensorflow基础

1. 安装tensorflow

pycharm-file-settings-project interpreter-最右侧绿色添加按钮-搜索tensorflow-install packages

注意tensorflow只支持64位

2. 简介

TensorFlow 是一个使用数据流图进行数值计算的开源软件库。图中的节点代表数学运算，而图中的边则代表在这些节点之间传递的多维数组（张量）。

节点被称为op（opration）

图必须在会话（session）中启动

3. 构建图

默认图现在有三个节点, 两个 constant() op, 和一个matmul() op.

import tensorflow as tf

matrix1 = tf.constant([[3,3]])
matrix2 = tf.constant([[2],
                       [2]])
product = tf.matmul(matrix1, matrix2)

4. 启动图

方法一：

sess = tf.Session()
result = sess.run(product)
print(result)
sess.close()

方法二：

with tf.Session() as sess:
    result2 = sess.run(product)
    print(result2)

5. 数据结构 tensor

tensor 可以看作是一个 n 维的数组或列表.

6. 变量 variable

通常会将一个统计模型中的参数表示为一组变量. 例如, 你可以将一个神经网络的权重作为某个变量存储在一个 tensor 中. 在训练过程中, 通过重复运行训练图, 更新这个 tensor.

import tensorflow as tf

state = tf.Variable(0, name='counter')
one = tf.constant(1)
new_value = tf.add(state, one)
update = tf.assign(state, new_value)
init = tf.initialize_all_variables()

with tf.Session() as sess:
    sess.run(init)
    print(sess.run(state))  # 0
    for _ in range(3):
        sess.run(update)
        print(sess.run(state))  # 1 2 3

7. 占位符 placeholder

在运行时在使用feed_dict输入值

import tensorflow as tf
input1 = tf.placeholder(tf.float32)
input2 = tf.placeholder(tf.float32)
output = tf.multiply(input1, input2)
with tf.Session() as sess:
    print(sess.run(output, feed_dict={input1:[7], input2:[2]}))

8. 激活函数 activation function

只有两三层的神经网络，隐藏层可以使用任意激活函数。卷积神经网络推荐relu，循环神经网络推荐relu或tanh。

多层神经网络需要谨慎选择激活函数。

9. 添加神经层

def add_layer(inputs, in_size, out_size, activation_function=None):
    Weight = tf.Variable(tf.random_normal([in_size, out_size]))  # 初始权重随机
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)  # biases推荐不为0，所以需要加上0.1
    Wx_plus_b = tf.matmul(inputs, Weight) + biases  # 激活前
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return outputs

示例：

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt


def add_layer(inputs, in_size, out_size, activation_function=None):
    Weight = tf.Variable(tf.random_normal([in_size, out_size]))  # 初始权重随机
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)  # biases推荐不为0，所以需要加上0.1
    Wx_plus_b = tf.matmul(inputs, Weight) + biases  # 激活前
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return outputs


# 数据准备
x_data = np.linspace(-1, 1, 300)[:, np.newaxis]   # 生成[-1,1]之间的300个数，组成300行的一个数组
noise = np.random.normal(0, 0.05, x_data.shape)  # mean = 0;std = 0.05; 格式：x_data
y_data = np.square(x_data) - 0.5 + noise  # y = x^2 - 0.5
# 搭建神经网络
# 由于输入一维，输出一维，所以我们定义的神经网络为输入层一个神经元，输出层一个神经元，中间隐藏层10个神经元
xs = tf.placeholder(tf.float32, [None, 1])  # None表示sample数量任意
ys = tf.placeholder(tf.float32, [None, 1])
l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)  # 隐藏层
prediction = add_layer(l1, 10, 1, activation_function=None)  # 输出层
# 计算损失函数
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction), reduction_indices=[1]))   # 距离平方求和求平均，reduction_indices表示数据处理的维度
# 训练
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)  # learning rate = 0.1
# 初始化
init = tf.initialize_all_variables()  # 初始化所有变量
sess = tf.Session()
sess.run(init)

fig = plt.figure()
ax = fig.add_subplot(1, 1, 1)
ax.scatter(x_data, y_data)
plt.ion()  # 保证连续输出

# 可视化输出
for i in range(1000):
    sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
    if i % 50 == 0:  # 每50个数据输出一次
       try:  # 为了避免第一次remove时报错
           ax.lines.remove(lines[0])
       except Exception:
           pass
       prediction_value = sess.run(prediction, feed_dict={xs: x_data})
       lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
       plt.pause(0.1)  # 暂停0.1秒