常用machine learning数据集

ImageNet非商业化的可视化大数据

截止到2015年5月1日,ImageNet数据库拥有超过1500万的图像。

      

 

cifar1010类物体识别数据集

数据集中包含60,000幅32*32图像,共10类物体(6,000幅图像/类)

其中,50,000作为training images,10,000作为testing images

mnist手写字体识别数据集

即10类数据识别问题,数字0-9,每个数字图像为28*28的黑白图像,每个数字有6,000幅图像

整个数据集包含60,000幅图像(6,000/数字),其中,60,000 training examples和10,000 testing examples

[1]  深度学习 vs.大数据:神经网络权值的版权属于谁

[2] Deep learning datasets

原文地址:https://www.cnblogs.com/lutingting/p/5170353.html