关于机器学习所需要的测试数据集合

关于机器学习所需要的测试数据集合

Kaggle网址(用的最多):https://www.kaggle.com/datasets

UCI数据集网址(其次): http://archive.ics.uci.edu/ml/

scikit-learn网址(最少):http://scikit-learn.org/stable/datasets/index.html#datasets

训练数据

1、计算机视觉

(1)人脸数据:

A、香港中文大学训练数据集:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html  

此数据库包含了20w张人脸图片,每张图片标注了5个特征点、以及几十种属性(是否微笑、肤色、发色、性别等属性)

B、68个人脸特征点:http://ibug.doc.ic.ac.uk/resources/facial-point-annotations/

此网站差不多可以下载到3000张,训练数据图片,每张图片标注了68个人脸特征点

C、74个人脸特征点:http://gaps-zju.org/DDE/ 

这个网站包好了1.4w张的人脸训练数据图片,每张图片标注了74个人脸特征点。不过这个数据感觉标注的很不精确

D、性别与年龄训练数据:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

这个网站包含了500k+的人脸性别与年龄训练数据,同时还有文献及代码,对于搞性别年龄预测,资源充足

(2)深度估计、图像分割:

A、RGBD训练数据列表:http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/

2、自然语言

(1)问答系统:https://github.com/karthikncode/nlp-datasets

原文地址:https://www.cnblogs.com/fwl8888/p/9900933.html