取出所有的连接

# 取出所有的连接

# coding: utf-8
import sys, os, random, time, datetime
import urllib, re

reload(sys)
sys.setdefaultencoding('utf-8')
text = urllib.urlopen("http://www.qq.com").read()
regex = r'''(<a[^>]*?href="([^"]+)"[^>]*?>)|(<a[^>]*?href='([^']+)'[^>]*?>)'''
result_s = re.findall(regex, text)
for result in result_s:

print result[1]

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/xiongwei/p/3358805.html

推荐文章
oracle 清理跟踪文件.trc .trm
Linux下挂载新磁盘
分区工具parted的详解及常用分区使用方法
Linux设置history命令显示行数以及时间
Linux之awk用法
Linux之sort用法
Linux之grep用法
Linux之cut用法
Linux之 sed用法
护眼配色参数
vi快捷键使用大全
jQuery实现图片延迟加载
数据库返回刚插入记录的ID
Solr开发文档
JQuery的Ajax跨域请求的解决方案
在DOS使用SVN之执行命令整理(TortoiseProc.exe)
Jquery读取XML文件
ToString()、Convert.ToString()、(string)、as string 的区别
Apache Solr 介绍
高效的分页存储过程
springboot内置分页技术
打印正三角,倒三角,实心棱形,空心棱形
显示Pl/Sql Developer window list窗口
Oracle 中使用正则表达式
前端使用pdf.js预览pdf文件,超级简单
tomcat8踩坑：url包含|等特殊字符报错400的问题
使用 Itext 生成PDF字节数组(文件流不落地)
使用 Itext 生成PDF
回车提交事件
python爬虫之re正则表达式库