python3 正则re

一、正则简介

首先你得导入正则方法 import re 正则表达式是用于处理字符串的强大工具，拥有自己独立的处理机制，效率上可能不如str自带的方法，但功能十分灵活给力。它的运行过程是先定一个匹配规则（”你想要的内容+正则语法规则”）,放入要匹配的字符串，通过正则内部的机制就能检索你想要的信息。

二、findall用法

基本结构大致: nojoke = re.findall(r’匹配的规则’,’要检索的愿字符串’)
nojoke就是我们最后通过正则返回的结果
re正则findall查找全部r标识代表后面是正则的语句

基本用法
^ 表示开头
$ 表示结尾
[...] 或
d 返回0-9数字

注意结果不是连续的字符串

可以通过多个d 解决想要的长度

D 数字以外
w 所有字母和数字，相当于[0-9a-zA-Z]
W 和w相反，取特殊符号
.*取最大化内容
多个?，限制,匹配前一个字符1次或0次

** 三、mathch 和 search

re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。re.search 扫描整个字符串并返回第一个成功的匹配

** 四、sub替换

sub用于替换字符串中的匹配项,语法一般是re.sub(r’正则匹配规则’，’替换的字符串’，需要检索的字符串)

'.'     默认匹配除
之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行
'^'     匹配字符开头，若指定flags MULTILINE,这种也可以匹配上(r"^a","
abc
eee",flags=re.MULTILINE)
'$'     匹配字符结尾，或e.search("foo$","bfoo
sdfsf",flags=re.MULTILINE).group()也可以
'*'     匹配*号前的字符0次或多次，re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']
'+'     匹配前一个字符1次或多次，re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
'?'     匹配前一个字符1次或0次
'{m}'   匹配前一个字符m次
'{n,m}' 匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
'|'     匹配|左或|右的字符，re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
'(...)' 分组匹配，re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c
 
 
'A'    只从字符开头匹配，re.search("Aabc","alexabc") 是匹配不到的
''    匹配字符结尾，同$
'd'    匹配数字0-9
'D'    匹配非数字
'w'    匹配[A-Za-z0-9]
'W'    匹配非[A-Za-z0-9]
's'     匹配空白字符、	、
、
 , re.search("s+","ab	c1
3").group() 结果 '	'

re.match 从头开始匹配
re.search 匹配包含
re.findall 把所有匹配到的字符放到以列表中的元素返回
re.splitall 以匹配到的字符当做列表分隔符
re.sub      匹配字符并替换