numpy, pandas, matplotlib等常用库的学习手册

pandas介绍:

待续

参考资料:

中文:https://www.cnblogs.com/skying555/p/5914391.html

英文:http://www.datadependence.com/2016/05/scientific-python-pandas/

numpy介绍:

待续

参考资料:

https://www.jianshu.com/p/83c8ef18a1e8

Matplotlib

Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。

待续

gensim介绍:

在安装gensim需要注意,gensim 用conda install gensim 与pip install gensim 安装是不同的,个人建议用anaconda安装。操作系统系统最好使用linux。

在Windows环境下,使用pip安装gensim会出现以下问题:

sklearn

sklearn是机器学习中一个常用的python第三方模块,网址:http://scikit-learn.org/stable/index.html ,里面对一些常用的机器学习方法进行了封装,在进行机器学习任务时,并不需要每个人都实现所有的算法,只需要简单的调用sklearn里的模块就可以实现大多数机器学习任务。机器学习任务通常包括分类(Classification)和回归(Regression),常用的分类器包括SVM、KNN、贝叶斯、线性回归、逻辑回归、决策树、随机森林、xgboost、GBDT、boosting、神经网络NN。常见的降维方法包括TF-IDF、主题模型LDA、主成分分析PCA等。
 
 

补充

学习如何使用这些包应该直接去阅读官方文档,现在网上的博客质量大多都良莠不齐,并且也不系统,最好的方式是直接去阅读官方文档,但是苦于英语水平,直接阅读官方文档也不太现实。幸好有一些网络界的雷锋同志给我们翻译了这些文档:

numpy中文文档:https://www.numpy.org.cn/index.html

panda中文文档:https://www.pypandas.cn/index.html

matplotlib中文文档:https://www.matplotlib.org.cn/index.html

这个三个文档应该是同一个团体翻译的,里面有一些翻译错误,并且翻译也不算完全。

还有就是一个叫ApacheCN的团体,翻译了很多文档和机器学习的书籍,同样也包括numpy, panda, matplotlib这个三个文档。

地址:https://github.com/DaiKuai/home

python也自带查询功能,例如help(sum)就可以查询sum函数的具体用法。

吐槽

有时候我常常在想,写博客是不是要事无巨细,什么都往上写,但是我后来想了想,这样没有必要,也很浪费时间,因为有很多工作,人家做的比你好的多,这个时候你只需要学习别的人工作就行了,没有必要自己再做一遍。

原文地址:https://www.cnblogs.com/mlgjb/p/9734874.html