获取minist数据并转换成lmdb

caffe本身是没有数据集的,但在data目录下有获取数据的一些脚本。MNIST,一个经典的手写数字库,包含60000个训练样本和10000个测试样本,每个样本为28*28大小的黑白图片,手写数字为0-9,因此分为10类。

1.获取数据

     sudo sh ./data/mnist/get_mnist.sh  

这个是在caffe的目录下执行的。运行成功后,在caffe/data/mnist/目录下有四个文件:

train-images-idx3-ubyte:训练集样本 (9912422 bytes) 

train-labels-idx1-ubyte: 训练集对应标注 (28881 bytes) 

 t10k-images-idx3-ubyte: 测试集图片 (1648877 bytes)

 t10k-labels-idx1-ubyte: 测试集对应标注 (4542 bytes)

这些数据不能在caffe中直接使用,需要转换成LMDB数据

2.转换成lmdb数据

    sudo sh ./examples/mnist/create_mnist.sh 

这个也是在caffe的目录下执行的。但运行过程中出现了以下错误:

这是因为这个脚本本身要调用convert_mnist_data的二进制文件,需要将convert_mnist_data编译。我使用的caffe并没有编译。

caffe编译之后生成build文件夹,convert_mnist_data.bin就在build文件夹里。

使用编译过后的caffe就能正常转换了:

原文地址:https://www.cnblogs.com/ymjyqsx/p/7727306.html