爬虫（三）-之Urllib库的基本使用

什么是Urllib

Urllib是python内置的HTTP请求库

包括以下模块

urllib.request　　请求模块

urllib.error　　异常处理模块

urllib.parse 　　url解析模块

urllib.robotparser　　robots.txt解析模块

关于urllib.request.urlopen参数的介绍：

urllib.request.urlopen(url,data=None,[timeout,]*,cafile=None,capath=None,cadefault=False,context=None)

先写一个简单的例子：

import urllib.request

response = urllib.request.urlopen('http://www.baidu.com')
print(response.read().decode('utf-8'))

urlopen一般常用的有三个参数，它的参数如下：
urllib.requeset.urlopen(url,data,timeout)
response.read()可以获取到网页的内容，如果没有read()，将返回如下内容

上述的例子是通过请求百度的get请求获得百度，下面使用urllib的post请求