用python3.3爬取图片

这篇文章是看了网上有人写了之后,才去试试看的,但是因为我用的是python3.3,与python2.x有些不同,所以就写了下来,以供参考。

get_webJpg.py

 1 #coding=utf-8
 2 import urllib.request
 3 import re
 4 
 5 def getHtml(url):
 6     html = urllib.request.urlopen(url).read()
 7     return html
 8 
 9 def getImg(html):
10     reg = r'src="(.+?.jpg)" pic_ext' #正则表达式
11     imgre = re.compile(reg)
12     imglist = re.findall(imgre, html)
13     
14     x = 0
15     for imgurl in imglist:
16         urllib.request.urlretrieve(imgurl,'%s.jpg' %x)
17         x += 1
18         
19     #return imglist
20     
21 html = getHtml("http://tieba.baidu.com/p/2460150866").decode('utf8')
22 print(getImg(html))

结果就是把网上那些图片下载到与get_webJpg.py同一个目录下了:

原文地址:https://www.cnblogs.com/lldxz/p/4979825.html