python--正则表达式

一、python的正则

　　1.python的正则表达式利用re模块

import re

# 使用match方法进行匹配操作
result = re.match(正则表达式,要匹配的字符串)

# 如果上一步匹配到数据的话，可以使用group方法来提取数据
result.group()

二、正则规则

　　1.字符串

　　2.表示数量

　　3.字符串前加r，表示自动转义，在正则表达式中无须在使用进行转义

　　4.表示边界

　　5.匹配分组

#分组匹配
s = "<html><h1>hello world</h1></html>"

res = re.match(r"<(.+)><(.+)>.+</2></1>", s)
print(res.group())

#起别名

s = "<html><h1>hello world</h1></html>"

re.match(r"<(?P<key1>.+)><(?P=<key2>.+)>.+</(?P=key2)></(?P=key1)>", s)

　　6.match,search,findall

　　　　(1) match：从首字母开始开始匹配，string如果包含pattern子串，则匹配成功，返回Match对象，失败则返回None，若要完全匹配，pattern要以$结尾。

　　　　(2) search：若string中包含pattern子串，则返回Match对象，否则返回None，注意，如果string中存在多个pattern子串，只返回第一个。

　　　　(3) findall：返回string中所有与pattern相匹配的全部字串，返回形式为数组。

　　7.使用sub方法实现批量替换

　　　　re.sub(正则规则，要替换成的字符串或一个函数（返回值相当于字符串），要替换的字符串)