data analysis (summary & next step)

      从Mar 25到现在May 7,3月25到5月7号,算起来也有一个半月,终于初步完成了这本书的学习,从numpy到pandas,再到matplotlib,对python有个初步的认识和理解,那么下一步该通过例子来加强和巩固所学的东西,再花一周的时间把基础全部给过一遍,总结和写博客。 

     在这一步完成后,开始搞kaggle,找俩个例子,精读。        [2018年05月07日22:47:44]

   说好的一周实际上花了差不多一周耶,感觉时间花都了,近期健身回来感觉有点累,但比以前躺着就睡着了好多了,很喜欢这种状态。那么接下来帮助朋友把论文中数据分析搞定,然后开始进军kaggle啦。   [2018年05月15日23:20:38]

文件处理:  csv, table, json, txt, db
数据排序:  value_counts, argsort, sort_values, searchsorted
分组分类:  groupby, pivot_table, stack, unstack, unique, cut, qcut
数据截取:  take, loc, iloc, head, tail
可视化:  直方图,曲线图 (matplotlib, seaborn)
数据合并:  merge, concat, cumsum
数据过滤:  fillna, list迭代过滤, isin, drop_duplicates
数据转换:  rename, map转换, apply 

                             暂时这么多,看到后再分类[2018年05月07日23:08:34]

持续更新...

书籍《利用Python进行数据分析·第二版》 网上翻译来源

原文地址:https://www.cnblogs.com/zeroones/p/8975852.html