数据分析所需要的技术栈

1.数据库方面:MySQL(重要),Redis等

2.python基础语法(必备)

3.(必备)机器学习(决策树,SVM,贝叶斯,K-Means,Logistic Regression,随机森林,PCA等算法基本原理)、数据挖掘(scikit-learn,NLTK等)

4.(偏后端)WEB后端开发技术:协议,架构,存储,缓存,安全等

5.基本的统计学知识(加分)

6.正则表达式(加分)

7.python数据结构和算法

8.(必备)python数据分析类库(numpy,pandas,matplotlib,scipy)

9.python爬虫(Scrapy,xpath 或者beautifulsoup),了解html,css框架

10.python深度学习框架Tensorflow 或者pytorch

11.R语言基础语法,数据分析及可视化常用packages

12.(加分)熟悉Linux开发环境,熟悉常用的Linux命令

13.分布式平台使用经验,Hadoop,Hive,spark

14.熟练Git

15.(没有强要求)Excel,R,spss或者其他统计分析工具

原文地址:https://www.cnblogs.com/baili-luoyun/p/14200685.html