Spark大规模机器学习学习-开始的开始(数据科学家的开端)

------------------------------------本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢!--------------------------------

一直有想学习和写关于Spark大规模机器学习的东西,最近工作慢慢理顺了很多,终于可以来写关于这部分的内容,一方面激励和监督自己的学习过程,另一方面也记录自己学习历程、方便以后查阅。

内容会分为六条线:

一、机器学习-实战(Python),主要是机器学习实战这本书的学习记录和基本的数据处理流程;

二、Spark学习记录(包括Spark基础+Spark机器学习)

三、edx关于spark的学习笔记、最新的一些算法的学习记录,例如deep-learning(Tensor-flow、MXnet代码来自Github分享);

五、关于最新一些趋势和新闻的总结提炼

六、一些有趣小项目的记录;参考语言主要是python、R、java、scala等,但是希望以后也可以将部分算法用C/C++来实现,最后就可能实际写作中不限于这5条线:)

一、机器学习-实战(Python)(7-9月完成)

二、Spark学习记录(包括Spark基础+Spark机器学习)(不定期更新)

三、edx关于spark的学习笔记(不定期更新)

四、最新的一些算法的学习记录、例如deep-learning(Tensor-flow、MXnet)(不定期更新)

五、关于最新一些趋势和新闻的总结提炼(不定期更新)

六、一些有趣小项目的记录(不定期更新)

资料&闲杂内容

 

  

原文地址:https://www.cnblogs.com/datalearner1st/p/5645508.html