Data

01 - NumPy

NumPy(数值 Python 的简称)是用Python实现的用于科技计算的基础软件包,是一个强大的科学分析和建模工具

  • 提供了大量数据结构,能够轻松地执行多维数组和矩阵运算
  • 可用作不同类型通用数据的多维容器
  • 可以和其他编程语言无缝集成
  • 可以简单而快速地与大量数据库和工具结合

官网信息

02 - Pandas

针对Python语言的开源数据分析处理工具,可以提供高性能、易用的数据结构;

官网信息

03 - Matplotlib

Python语言的绘图库,功能强大,可绘制出各种专业的图像,支持各种平台,可实现定制

官网信息

HomePage:https://matplotlib.org/

04 - StatsModels

Statsmodels is a Python module that provides classes and functions for the estimation of many different statistical models, as well as for conducting statistical tests, and statistical data exploration.

  • 提供强大的数据统计、测试、探索、分析、建模和可视化功能
  • 利用Pandas对象作为基础数据容器进行计算
  • 包含一些经典的统计方法,比如贝叶斯方法和一个机器学习的模型

官网信息

其他 - StatsModels

导入statsmodels.api时,出现类似“No module named 'patsy'”的报错

import statsmodels.api as sm
ModuleNotFoundError: No module named 'patsy'

确认当前环境是否已安装patsy模块。

05 - Seaborn

Seaborn is a Python data visualization library based on matplotlib.
It provides a high-level interface for drawing attractive and informative statistical graphics.

官网信息

06 - ECharts

Echarts是一个由百度开源的使用 JavaScript 实现的数据可视化库,具备良好的交互性,精巧的图表设计。

官网信息

07 - Pyecharts

Pyecharts是一款将python与echarts结合的强大的数据可视化工具

官网信息

08 - OpenRefine

A free, open source, powerful tool for working with messy data.
OpenRefine is a Java-based power tool that allows you to load data, understand it, clean it up, reconcile it, and augment it with data coming from the web. All from a web browser and the comfort and privacy of your own computer.

官网信息

参考信息

09 - Bokeh

免费开源的交互式图形工具,能读取大型数据集或者流数据,以简单快速的方式为网页提供优美、高交互性能的图形。

官方资料

安装参考

官方推荐的安装方式是使用Anaconda Python及其附带的Conda包管理系统(https://www.anaconda.com/distribution/)

参考消息

原文地址:https://www.cnblogs.com/anliven/p/10352782.html