数据分析 numpy matplotlib

numpy  

矩阵操作

 

matplotlib

 

 

 

 

 

 

2.2折线图

 

 

 

 

 

 中文实现问题解决

 

 添加网络格显示

  True时确认使用网格 可以不写       alpha 透明度

 添加信息  (标题   x,y轴名称)

 

 

          

 

 

 

 散点图

 

 柱状图

 

      

 

直方图

 

 

 

 

 

饼图

           

 

总结

Numpy

 

 

类型

ndarray的方法

 

 

           np.random.yniform()

 

 

                np.random.noraml()

   size=(8,10)

       注意stock_change是变量名

     修改形状

 

 

 

ndarry 运算

                                                      

 

   满足stock_change   >0.5的数据变为1.1

 

 

 

 

 统计运算

 

 std 波动    mean平局值

数组操作

 

 

广播机制应用于  数组 不应用于矩阵

 

 

 

 

 矩阵运算

    np.mat()                                     

 

矩阵可以运算不代表数组可以运算

 合并分割

         

   水平拼接hstack 竖直拼接vstack

 concatenate

 分割

 

IO操作 (numpy 只能读取数字不能读取字符串)

 

 

 

 

Pandas

 

 

 

 values = ndarray(不带索引)head()   tail()

 

 以字典设置新索引

 

multiindex   与 panel 

  

 

 

 

 

series(一维的)

     

 

 数据基本操作

 

 

 

索引                                                                                                                                                     按名字索引

 

 

 赋值+排序

 

 

 series

Dateframe   运算

 4.3.3统计运算

4.3.4自定义运算

   add()可以使用   .head()

    减法

 

 

 axis = 0列  =1行

 

 

 

   

 

文件读取与存储                                                           

 csv                                                                                                                         当文件没有字段 的话(会把第一行默认为字段)   就用    names 参数把字段添加进来

存储

没有行索引                                                                                 header 设置字段

    

   line=true

 

 mysql

 

 

 

 

 

       inplace= TRUE

 

 

                               

 

 

 

 

 

 

 

   

 

 

内连接

左表为准 右表有则连接 没有则用null    

   

 

 

 

 

          

      stacked 堆叠显示

 

 

 

 

 

 

 

原文地址:https://www.cnblogs.com/qj696/p/13192935.html