手写数字识别
-
MNIST数据集
提供 6万张 28*28 像素点的0~9手写数字图片和标签,用于训练。
提供 1万张 28*28 像素点的0~9手写数字图片和标签,用于测试。
0~255代表像素点的灰度值
数据存储[28,28,1] (28行,28列,每一个点的数据)
-
输入:
将二维数组打平成一维数组变为[28*28]即[784]
x:[b,784] (b表示有多少张图片)
-
输出:
最简单的方法:给每一个类具体编号一个具体的数值例如 dog = 0,cat = 1, fish= 2 ···
问题:
- 数字之间有大小关系但是类别之间没有
- 输出并不符合概率学上的概念
另一种方法:把每一种具体的类别理解为一种具体的load(具体的节点的输出)
- 每个load之间没有顺序关系的属性
- 每个load有一个具体的实数值(数值为表示属于当前类别的0~1之间的概率,并所有load之和为1)