Python之re模块

re模块下的常用方法

import re

ret = re.findall('a', 'ha ha xiao')  # 返回所有满足匹配条件的结果,放在列表里
print(ret)  # 结果 : ['a', 'a','a']

ret = re.search('a', 'ha ha xiao')
print(ret.group())  # 结果 : 'a'
# 函数会在字符串内查找模式匹配,只到找到第一个匹配然后返回一个包含匹配信息的对象,该对象可以
# 通过调用group()方法得到匹配的字符串,如果字符串没有匹配，则返回None。

ret = re.match('a', 'abc')  # 从头开始匹配，如果正则从头开始就可以匹配上，就返回一个变量，调用group可以查看，若没有匹配上则返回None,调用group会报错
print(ret.group())
# 结果 : 'a'

ret = re.split('[ab]', 'abcd')  # 先按'a'分割得到''和'bcd',在对''和'bcd'分别按'b'分割
print(ret)  # ['', '', 'cd']

ret = re.sub('d', 'H', 'hao3xing4an5', 1)  # 将数字替换成'H'，参数1表示只替换1个
print(ret)  # haoHxing4an5

ret = re.subn('d', 'H', 'hao3xing4an5')  # 将数字替换成'H'，返回元组(替换的结果,替换了多少次)
print(ret)

obj = re.compile('d*')  # 将正则表达式编译成为一个 正则表达式对象，规则要匹配的是多个数字
ret = obj.search('qera123efgh')  # 正则表达式对象调用search，参数为待匹配的字符串
print(ret.group())  # 结果 ： 123

import re
ret = re.finditer('d', 'aew3ss4686wwq')   # finditer返回一个存放匹配结果的迭代器
print(ret)  # <callable_iterator object at 0x7fb5c6b8fc50>
print(next(ret).group())  # 查看第一个结果,注意结果是字符串类型
print(next(ret).group())  # 查看第二个结果
print([i.group() for i in ret])  # 查看剩余结果

注意：

1、findall的优先级查询

import re

ret = re.findall('haohao ai (basketball|football)', 'haohao ai basketball')
print(ret)  # ['basketball']     这是因为findall会优先把匹配结果组里内容返回,如果想要匹配结果,取消权限即可

ret = re.findall('haohao ai (?:basketball|football)', 'haohao ai basketball')
print(ret)  # ['haohao ai basketball']

2、split的优先级查询

import re
ret = re.split('d+','haha3xiao6le')
print(ret)  # 结果['haha','xiao','le']

ret = re.split('(d+)','haha3xiao6le')
print(ret)  # 结果['haha','3','xiao','6','le']

# 在匹配部分加上()之后输出的结果不同，加上()保留了分割元素