课时3 计算机视觉历史回顾与介绍下

ImageNet有5000万张图片，全部都是人工清洗过得，标注了超过2万个分类。

CS231n将聚焦于视觉识别问题，图像分类关注的是大图整体；物体检测告诉你东西具体出现在图片的哪里以及物体之间的联系是什么之类的。

CNN是深度学习架构的一种，2012年之前的imageNet，都是特征+支持向量机的，也是分层结构，但没有端到端的特征；

Kunihiko Fukushima提出了一个模型，称为Neocognitron，是神经网络架构的开端。

数据本身并没有什么意义，但是在深度学习架构中，数据成了高性能架构的驱动力，来执行端到端的训练，帮助解决过拟合问题，只要有足量的数据。

愿景：给电脑一张图片，电脑可以输出描述性文字（一句话之类的）。