python 不得不知的第三方库以及常用安装包

mysql 驱动
$ sudo pip install MySQL-python

redis 数据库
$ sudo pip install redis

django 全文搜索
$ sudo pip install django-sphinx

 

selenium集成测试工具,配合phantomJS可以模拟浏览器操作
$ sudo pip install selenium

 

SQLAlchemy 是一个Python 的SQL 工具包以及数据库对象映射框架,示例代码:

user1 = User(name='user1')
session.add(user1)

session.commit()

 

Flask 是一个微型的 Python 开发的 Web 框架,示例代码:

from flask import Flask
app = Flask(__name__)

@app.route("/")
def hello():
    return "Hello World!"

if __name__ == "__main__":
    app.run()

BeautifulSoup 库是一个非常神奇的 “粗糙的解析器”,用于解析实际 Web 页面中包含的有效 HTML。

PyQuery (with lxml)

安装方法 pip install pyquery

Python 解析 HTML 时最经常被推荐的是 Beautiful Soup ,而且它的确也表现很好。提供良好的 Python 风格的 API,而且很容易在网上找到相关的资料文档,但是当你需要在短时间内解析大量文档时便会碰到性能的问题,简单,但是真的非常慢。

fuzzywuzzy

安装方法:pip install fuzzywuzzy

fuzzywuzzy 可以让你对两个字符串进行模糊比较,当你需要处理一些人类产生的数据时,这非常有用。

sh

安装方法:pip install sh

sh 可让你调用任意程序,就好象是一个函数一般:

from sh import git, ls, wc

# checkout master branch
git(checkout="master")

# print(the contents of this directory
print(ls("-l"))

# get the longest line of this file
longest_line = wc(__file__, "-L")

pattern

安装方法:pip install pattern

Pattern 是 Python 的一个 Web 数据挖掘模块。可用于数据挖掘、自然语言处理、机器学习和网络分析。

原文地址:https://www.cnblogs.com/weiok/p/4752913.html