经典的数据集汇总

名称 训练集 测试集 说明  
MNIST手写体数据集 60000张 10000张 10个类别,每张图片28*28 单标签、多分类
IMDB电影评论数据集

25000条评论

50%正

50%负

25000条评论

50%正

50%负

  二分类
 路透社数据集 8982个样本 2246个样本 

46个不同的新闻主题,训练集中每个主题都有至少10个样本

每个样本都是一个整数列表 

单标签、多分类

 波士顿房价数据集 404条  102条  506条样本,每个样本有13个特征,特征的取值范围可能不一样  回归

 猫狗图像数据集

2013年kaggle比赛

 自定义 自定义 

 12500张猫

 12500张狗

CNN

ImageNet数据集     

140万张标记图像,

1000个不同种类,包含许多动物类别,其中包含不同种类的猫和狗

CNN
 Glove词嵌入  400000个单词的100维嵌入向量  LSTM、RNN
 耶拿天气数据集      每10分钟记录14个不同的量(比如气温、气压、湿度、风向等)

LSTM

温度预测

 CelebA名人人脸数据集     超过20万张名人肖像  VAE
 CIFAR10数据集     50000张32*32的RGB图像,有10个类别,每个类别5000张图像 GAN
原文地址:https://www.cnblogs.com/nxf-rabbit75/p/10137219.html