re模块的基本用法

findall:返回每一个匹配的标的,放在一个列表里

ret = re.findall('i','aike listen to me')
print(ret)

#打印:
['i', 'i']

search:返回第一个匹配到的匹配信息,需要调用group方法才能将标的打印,若没有匹配到,返回None

ret = re.search('i','aike listen to me')
print(ret)
print(ret.group())

#打印:
<re.Match object; span=(1, 2), match='i'>
i

一般使用方法为:
ret = re.search('i','aike listen to me')
if ret:
    print(ret.group())

match:以什么为开头,返回匹配标的的匹配信息,需要调用group方法才能将标的打印出来,若没有匹配,则返回None

ret = re.match('ai','aike listen to me')
print(ret.group())

#打印:
ai

split:切割

ret = re.split('[ab]', 'abcd')   # 先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割
print(ret)  # ['', '', 'cd']


ret = re.split('(ab)', 'abcd') #优先级的原因,加上括号会保留需要切割的内容
print(ret)  #['', 'ab', 'cd']

sub:更换符合匹配规则的标的,可以设置更换次数,默认全部更换

ret = re.sub('i','1','aike listen to me',1)
print(ret)

#打印:
a1ke listen to me

subn:更换符合匹配规则的标的,可以设置更换次数,默认全部更换。返回一个元祖(更换后的结果,更换次数)

ret = re.subn('i','1','aike listen to me')
print(ret)

#打印:
('a1ke l1sten to me', 2)

compile:编译字符串类型的正则表达式

job = re.compile('d{4}') #将正则表达式编译成一个正则表达式对象,规则匹配的是4个连续的数字
ret = job.search('1121aaa12ak4543as6adas1111aa1524a') #正则表达式对象调用search方法,参数为待匹配的字符串
print(ret.group()) #1121

finditer:返回一个存放匹配结果的迭代器

ret = re.finditer('d{4}','1121aaa12ak4543as6adas1111aa1524a')
print(ret.__next__().group())
print(ret.__next__().group())
for i in ret:
    print(i.group())

#打印:
1121
4543
1111
1524

findall的优先级:

ret = re.findall('name(aike)','nameaikename') #findall会先把优先组里匹配到的标的返回
print(ret)

ret = re.findall('name(?:aike)','nameaikename')#想要获取全部的匹配结果,取消权限方式是在优先组里面加'?:'
print(ret)

#打印:
['aike']
['nameaike']

split的优先级:

ret = re.split('(d)','hello1ai2ke')
print(ret)#加上括号,会保留匹配的标的

ret = re.split('d','hello1ai2ke')
print(ret)#正常情况下不会保留

#打印:
['hello', '1', 'ai', '2', 'ke']
['hello', 'ai', 'ke']
原文地址:https://www.cnblogs.com/aizhinong/p/11420649.html