python检查URL是否能正常访问

https://blog.csdn.net/u010798367/article/details/53008439

今天,项目经理问我一个问题,问我这里有2000个URL要检查是否能正常打开,其实我是拒绝的,我知道因为要写代码了,正好学了点python,一想,python处理起来容易,就选了python,开始把思路想好:

1.首先2000个URL。可以放在一个txt文本内

2.通过python 把内容内的URL一条一条放进数组内

3.打开一个模拟的浏览器,进行访问。

4.如果正常访问就输出正常,错误就输出错误

直接简单粗暴甩代码。因为涉及到隐私,图片打了码

  1.  
    import urllib.request
  2.  
    import time
  3.  
     
  4.  
    opener = urllib.request.build_opener()
  5.  
    opener.addheaders = [('User-agent', 'Mozilla/49.0.2')]
  6.  
    #这个是你放网址的文件名,改过来就可以了
  7.  
    file = open('test.txt')
  8.  
    lines = file.readlines()
  9.  
    aa=[]
  10.  
    for line in lines:
  11.  
    temp=line.replace(' ','')
  12.  
    aa.append(temp)
  13.  
    print(aa)
  14.  
     
  15.  
    print('开始检查:')
  16.  
    for a in aa:
  17.  
    tempUrl = a
  18.  
    try :
  19.  
    opener.open(tempUrl)
  20.  
    print(tempUrl+'没问题')
  21.  
    except urllib.error.HTTPError:
  22.  
    print(tempUrl+'=访问页面出错')
  23.  
    time.sleep(2)
  24.  
    except urllib.error.URLError:
  25.  
    print(tempUrl+'=访问页面出错')
  26.  
    time.sleep(2)
  27.  
    time.sleep(0.1)

原文地址:https://www.cnblogs.com/DicksonJYL/p/9464316.html