机器学习、深度学习的理论与实战入门建议整理

引言

　　拿到这份文档时想必你的脑海中一直萦绕着这么一个问题，“机器学习/深度学习要怎么学呢？（怎么入门，又怎么进一步掌握？）”。关于这个问题其实并没有一个标准答案，有的人可能适合自底向上的学，也就是先从理论和数学开始，然后是算法实现，最后再通过一些项目去解决生活中的实际问题；有的人则可能适合自顶向下的学，也就是在弄清楚什么是机器学习及为什么学机器学习后，先确定一个系统性的用机器学习来解决实际问题的程序，然后找到一个合适的工具，接着再在各种数据集上做练习以不断加强自己的实践能力与巩固对算法的理解。而这份文档是希望能从纷繁众多的学习资料里为你整理出一个头绪，但即使是这样一个出发点，从最终的结果来看，也还是繁杂了一些，也许之后还会再整理出一个精简版，不过其实一些很不错的入门指南的链接在这份文档里也已列出，仔细找找就会有好东西喔。最后想借用Quora上一份对“I’m very interested in deep learning. How can I get hired?”问题的回答来作为这份学习建议的开场白：
　“Deep learning (Neural nets)/Machine learning is an ART. ART can never be mastered unless it is practiced. So instead of just learning about them , start exploring them by implementing one. there are outnumbered tutorials on net. choose either lib based implementation such as convnet or torch7 or caffe etc. or try implementing fully from scratch( this way u understand internal structures and linkages of algo better) .
　　Start off with small dataset instead of aiming on high .
　　Start off by minimal architecture.
　　U will learn a lot this way u gain confidence. then you can project yourself to the companies by posting link of ur github repository of machine /deep learning implementations. this will help u in the long run… “
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　—Good Luck

阶段一.机器学习入门

这是最基础也是最重要的一个阶段，借用台大的林轩田教授总结的几句话，在这个阶段我们要注重思考与理解这么几个问题：
1.什么是机器学习？
What is machine learning
2.什么时候机器可以学习（机器学习能为我们做什么）？
When can machines learn
3.为什么机器可以学习？
Why can machines learn
4.怎样让机器学习？
How can machines learn
5.怎样让机器学得更好？
How can machines learn better

阶段二.深度学习入门

　　
　　在对机器学习有了一定的掌握后，就可以开始在深度学习方面的学习了。刚开始要注意对神经网络的一些基本概念的掌握，如什么是感知机、什么是多层感知机（前馈神经网络）、BP算法的原理与推导等。个人觉得一个比较好的学习方式是，以视频教程为主理出一个清晰的思路，以经典书籍、博客文章、综述性论文为辅加深理解，同时，任何时候都不要忘了实践！

阶段三.实战入门

　　
　　“实战入门”并不是指从这里才开始实战，而是说到这个阶段可以去网上找一些感兴趣的开源项目玩一玩了。“开源”可以算是这个领域的一大特点了，从各个实验室到各大公司，都有非常多的开源项目值得学习，而且更新速度特别快，比如11月才举行的ECCV，部分已被录用的论文的代码现在已经开源了。寻找开源项目的方法有很多，大致可通过这么几个渠道：

1.公众号文章及微博的转发

公众号就是之前提到的那几个，微博的话“爱可可爱生活”更新的很勤，仔细找找应该能找到些有趣的

2.关注某个实验室或某个大牛的进展

许多在做着顶尖工作的实验室或大牛每年都会更新若干篇顶会顶刊的文章，其中部分是有开源代码的，关注那么几个感兴趣或和自己的方向比较相关的，时不时刷一刷没准会有些意外收获喔。这里推荐几个，但相信一定还有许多许多有待发现的。

实验室：

斯坦福
http://cvgl.stanford.edu/research.html
剑桥
http://www.cl.cam.ac.uk/research/rainbow/projects/
港中文
http://mmlab.ie.cuhk.edu.hk/projects.html
加州大学默塞德分校
http://vllab.ucmerced.edu/

大牛：

王晓刚
http://www.ee.cuhk.edu.hk/~xgwang/publications_topic.html

这是王晓刚列出的几个主要方向，各个方向下都有对应的paper和project，都是vision领域的，非常适合还不确定做哪个方向或尚不清楚有哪些方向的同学多看、多了解

何恺明
http://www.kaiminghe.com/
这个人就不用说了，一直是我们实验室特别关注的一个:)

Ross B. Girshick
https://people.eecs.berkeley.edu/~rbg/
俗称的rbg，从DPM到R-CNN三部曲，目标检测领域最近6、7年的重要进展几乎从未少过他的身影

Piotr dollár
http://pdollar.github.io/publications.html
这哥们也是目标检测领域不可错过的一个关注对象，而且他自己写的用于图像与视频处理的matlab工具箱特别好用，值得好好学习下。
https://github.com/pdollar/toolbox

Ming-Hsuan Yang
http://faculty.ucmerced.edu/mhyang/
一位非常高产的教授，主要涉猎方向为目标跟踪、显著性检测、语义分割

卢湖川
http://202.118.75.4/lu/publications.html
同样也是位高产的教授

Kaihua Zhang
http://kaihuazhang.net/
主要方向为目标跟踪与图像分割

Andrej Karpathy
http://cs.stanford.edu/people/karpathy/
这人前面有提过

3.project资源整合网站

前文提及的awesome-deep-learning上就有很多的projects汇总
https://github.com/ChristosChristofidis/awesome-deep-learning

CNN在检测、识别及分割上的应用
https://rawgit.com/gujiuxiang/gujiuxiang.github.io/master/blog/post/Convolutional_Neural_Networks/Convolutional_Neural_Networks.html
虽然只是论文链接，但基本上这些论文的源码都有公开，谷歌或百度一下就能找到

4.推荐几个值得一试的开源项目

目标识别：
首先当然还是从最经典的MNIST开始
http://yann.lecun.com/exdb/mnist/

然后可以在cifar-10,cifar-100继续图像分类
http://www.cs.toronto.edu/~kriz/cifar.html
https://www.kaggle.com/c/cifar-10/data

接着就可以尝试ImageNet了
http://image-net.org/index

目标检测：
Faster r-cnn
https://github.com/rbgirshick/py-faster-rcnn
YOLO
http://pjreddie.com/darknet/yolo/
SSD
https://github.com/weiliu89/caffe/tree/ssd

推特情感分析：
CNN实现
http://casa.disi.unitn.it/~moschitt/since2013/2015_SIGIR_Severyn_TwitterSentimentAnalysis.pdf

RNN实现
https://cs224d.stanford.edu/reports/YuanYe.pdf

图像风格迁移：
最初版
https://arxiv.org/abs/1508.06576v1 （论文）
https://github.com/dmlc/mxnet/tree/master/example/neural-style （代码）
http://phunter.farbox.com/post/mxnet-tutorial2 （博客介绍）

实时版
http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650719733&idx=3&sn=950a7adb4e93bca22e4ef975877482a9&chksm=871b018bb06c889ddc87bccaa0f35de5ca5a35c156cf1164d134d5010065d68dd06ba6e7cdfa&mpshare=1&scene=1&srcid=1012x07u3GoNxt6i3c5bLAre#rd

用RNN来”玩“音乐
http://www.hexahedria.com/2015/08/03/composing-music-with-recurrent-neural-networks/

用深度增强学习来玩游戏
http://karpathy.github.io/2016/05/31/rl/

用深度学习来给你的自拍打分
http://karpathy.github.io/2015/10/25/selfie/

用深度学习给黑白图像上色
https://twitter.com/ColorizeBot （需翻墙）

小结

最好的学习方式：理论+实践

最好的利用资源方式：不要急，一个一个来

　　这份学习建议的整理是希望你能从三个阶段来入门并逐渐掌握机器学习与深度学习，但就如引言中所说的，可能你看完了以后脑海中还是没有一条清晰的线，也就是“我现在要做什么、下一步做什么、然后呢···”，关于这个也许之后我会抽时间整理出一个step-by-step的学习建议。另外，在整理这份学习建议时还是有些仓促，再加上本人才疏学浅，有哪里错误或不得当的地方也希望能得到各位前辈的批评与指正，谢谢。最后，如果您也也曾收藏过一些本文未提及的不错的资源（入门或进阶皆可），那就请您在评论里和大家一起分享吧，学无止境，嗯，就酱！

转载说明：http://blog.csdn.net/zyj098765/article/details/52860183