Python基础-re正则模块

一、简介：
    正则表达式：是一种小型的、高度专业化的编程语言，(在Python中)它内嵌在Python中，并通过re模块实现，正则表达式模式被编译成
一系列的字节码，然后由用C编写的匹配引擎执行。

二、字符匹配(普通字符、元字符)
普通字符：
元字符：.   ^   $   *   +   ?   {   }   [   ]   |   (   )   

后边跟元字符去除特殊功能
后边跟普通字符实现特殊功能

d  匹配任何十进制数；相当于[0-9]
D  匹配任何非数字字符；相当于[^0-9]
s  匹配任何空白字符；相当于[ 	

fv]
S  匹配任何非空白字符；相当于[^ 	

fv]
w  匹配任何字母数字字符；相当于[a-zA-Z0-9_]
W  匹配任何非字母数字字符；相当于[^a-zA-Z0-9_]
  匹配一个单词边界，比如空格，&，#等

import re
匹配第一个满足的结果
print(re.search('fansik', 'fansik,,,,,fansik').group())

匹配手机号：
print(re.findall('^0?1[3|4|5|8][0-9]d{8}$', '13141466177'))

为分组取名字
print(re.search('(?P<id>d{3})/(?P<name>w{3})', 'asfda521/dfdsfaa').group('id'))
print(re.search('(?P<id>d{3})/(?P<name>w{3})', 'asfda521/dfdsfaa').group('name'))

取消组的优先级
print(re.findall('www.(w+).com', 'www.baidu.com'))
# 执行结果：
['baidu']

print(re.findall('www.(?:w+).com', 'www.baidu.com'))
# 取消优先级后的执行结果：
['www.baidu.com']


正则表达式的方法：
findall()：所有结果都返回到一个列表里
search()：返回匹配到的第一个对象(object)，对象可以调用group()返回结果
match()：只在字符串开始匹配匹配
print(re.match('fansik', 'fansikfanjinbao').group())
split()：以指定字符分割字符串

print(re.split('ma', 'fansikmafanjinbaomazhansanmalisi'))
执行结果：
['fansik', 'fanjinbao', 'zhansan', 'lisi']
re.sub()：字符替换
print(re.sub('ma', 'df', 'fansikmafanjinbaomazhansanmalisi'))
执行结果：
fansikdffanjinbaodfzhansandflisi
re.comile()：编译一个规则，使用与该规则被反复使用的情况下
obj = re.compile('.com')
print(obj.findall('fansik.com'))

常用的匹配规则
手机：/^0?1[3|4|5|8][0-9]d{8}$/
固话：/^0[d]{2,3}-[d]{7,8}$/
电子邮箱：/^([a-z0-9_.-]+)@([da-z.-]+).([a-z.]{2,6})$/
/^[a-zd]+(.[a-zd]+)*@([da-z](-[da-z])?)+(.{1,2}[a-z]+)+$/
用户名：/^[a-z0-9_-]{3,16}$/
密码：/^[a-z0-9_-]{6,18}$/
URL：/^(https?://)?([da-z.-]+).([a-z.]{2,6})([/w .-]*)*/?$/