大数据学习目录

  

推荐

1、gitbook 这里可以找到优秀的文章及书籍

2、about云 大数据论坛,网站上很多大数据资料

hadoop

博文:

1、Hadoop2.x集群安装配置笔记 初学搭建hadoop

2、搭建hadoop2.6.0 HDFS HA及YARN HA 启动hadoopHA容灾机制

3、Cloudera Manager(centos)安装详细介绍 使用CM搭建CHD版本hadoop平台

4、Ambari--大数据平台的搭建利器 使用ambari管理工具搭建HDP版本hadoop平台

书单:

1、hadoop权威指南

spark

1、厦门大学研究生课程《大数据处理技术Spark》 很好的入门教程简单易懂写的详细,作者是林子雨老师

2、Spark入门实战系列 这系列基本围绕了Spark生态圈进行介绍及实践的

python

1、零基础学 Python 初学入门非常好

2、Python教程 廖大神的教程 包含python2和3的教程

3、Python笔记 写的不错的笔记简单清晰

4、你是如何自学 Python 的? 太全了

scala

1、Scala 开发教程 极客学院的教程

2、Scala 教程 runoob.com的教程

machine learning & Data mining

博文:

1、spark机器学习笔记 原书是使用scala编码的,这篇是python语言的

2、机器学习个人笔记完整版v4.2 斯坦福大学中文笔记,感谢作者共享

3、使用sklearn做单机特征工程 博文中有多个好文章

4、scikit-learn文章翻译及实际项目 2015年翻译的实用作品

5、Machine Learning 非常好的英文博客,涉及机器学习和深度学习

6、机器学习算法一览(附Python和R代码) 基础算法,博主推荐

7、如何科学开启你的深度学习论文阅读生涯 作者会教大家如何独立阅读一篇论文

8、机器学习&人工智能博文 作者汇总了一些相关文章的连接

书单:

1、集体智慧编程

2、统计学习方法 李航

3、机器学习 周志华

竞赛

1、如何在 Kaggle 首战中进入前 10%

2、第一次参加Kaggle拿银总结

jenkins

1、Jenkins学习系列 适合入门级应用

docker

1、Docker--从入门到实践

书单

1、Kubernetes权威指南:从Docker到Kubernetes实践全接触(第2版)

MongoDB

博文

1、MongoDB 教程 入门级教程

2、mongodb.conf配置文件详解

视频

1、mongoDB入门篇

2、mongod配置选项说明 包含配置选项说明

书单

1、MongoDB权威指南

Elasticsearch

博文

1、Elasticsearch 权威指南(中文版) 入门必看

文章来源:https://blog.csdn.net/levy_cui/article/details/61614535

原文地址:https://www.cnblogs.com/30go/p/9855548.html