Python 数据分析

Python 是一种面向对象、直译式计算机程序设计语言,由 Guido van Rossum 于 1989 年底发明。由于他简单、易学、免费开源、可移植性、可扩展性等特点,Python 又被称之为胶水语言。下图为主要程序语言近年来的流行趋势,Python 受欢迎程度扶摇直上。

 
 

图片来源用 Python 玩转数据

由于 Python 拥有非常丰富的库,使其在数据分析领域也有广泛的应用。由于 Python 本身有十分广泛的应用,本期 Python 数据分析路线图主要从数据分析从业人员的角度讲述 Python 数据分析路线图。整个路线图计划分成 16 周,120 天左右。主要学习内容包括四大部分:

1)Python 工作环境及基础语法知识了解(包括正则表达式相关知识学习);

2)数据采集相关知识(python 爬虫相关知识);

3)数据分析学习;

4)数据可视化学习。

 
 

PYTHON 学习路径计划图

Python 工作环境及基础语法知识了解

对于 Python 基础语法学习部分,学习周期大概为 4 周,需要的相关资源在网络上都能找到免费的资源,而且质量都不错。相关中文资源如下:

1.python 工作集成环境包

Python(x,y): 下载地址

Pycharm:下载地址

2.python 数据分析相关库(Pandas/ Numpy/

Scipy/ Matplotlib)

如果安装了上面集成工作包,则下面的包不需要重新安装了。关于包的安装方法在学习资源图书中都有介绍,通常安装库采用 pip 方法,也可以用 pip list 查询系统安装了哪些库。

3. 学习资源

图书:1)Python 基础教程(第 2 版)[电子版图书自行百度]

2)深入浅出 Head First python(中文版)[电子版图书自行百度]

在线教程:1)廖雪峰的 python 教程

2)正则式学习

视频教程:1)慕课网 python 入门

2)慕课网 python 进阶

3)正则式学习视频

数据采集学习

对于数据采集部分的学习主要是通过 python 爬虫的学习了解基本的外部数据采集情况,当然也可以借助别人写好的规则库直接完成某些数据的采集。这部分内容的学习周期大概也为四周,需要的相关资源在网络上都能找到免费的资源,而且质量都不错。相关中文资源如下:

爬虫学习在线教程:

1.Python 爬虫入门一之综述

2.Python 爬虫入门二之爬虫基础了解

3.Python 爬虫入门三之 Urllib 库的基本使用

4.Python 爬虫入门四之 Urllib 库的高级用法

5.Python 爬虫入门五之 URLError 异常处理

6.Python 爬虫入门六之 Cookie 的使用

7.Python 爬虫入门七之正则表达式

8.Python 爬虫实战一之爬取糗事百科段子

9.Python 爬虫实战二之爬取百度贴吧帖子

10.Python 爬虫实战三之计算大学本学期绩点

11.Python 爬虫实战四之抓取淘宝 MM 照片

12.Python 爬虫进阶一之爬虫框架 Scrapy 安装配置

视频教程:Python 简单爬虫开发

数据分析

Python 数据分析的学习主要是对相关库的使用,比如数据整理需要用到 numpy 和 pandas 库,数据描述与分析分析则主要用到 pandas 库,从某种程度上讲,利用 python 进行数据分析的学习过程就是对库的学习过程。由于有了前面 2 部分内容的学习基础,本部分内容的建议学习练习时间也为 4 周,相关免费学习资源如下:

图书:利用 python 进行数据分析 [电子版图书自行百度]

视频:用 python 玩转数据 [视频为 cousera 认证课程,全程中文]

数据可视化

Python 数据可视化学习的过程就是学习 matplotlib 库的过程,matplotlib 库包含有丰富的数据可视化资源,地图、3D 等等都有涉及,如果有前面 3 部分的学习经验的话,这部分内容在 4 周内也能解决。相关中文学习资源如下:

图书:Python 数据可视化编程实战 [电子版图书自行百度]

在线教程:

1. 利用 Python 绘图和可视化(1)

2. 利用 Python 绘图和可视化(2)

原文地址:https://www.cnblogs.com/Gaimo/p/14887745.html