python3 正则re

一、 正则简介

首先你得导入正则方法 import re 正则表达式是用于处理字符串的强大工具,拥有自己独立的处理机制,效率上可能不如str自带的方法,但功能十分灵活给力。它的运行过程是先定一个匹配规则(”你想要的内容+正则语法规则”),放入要匹配的字符串,通过正则内部的机制就能检索你想要的信息。

二、findall用法

  1. 基本结构大致: nojoke = re.findall(r’匹配的规则’,’要检索的愿字符串’)
  2. nojoke就是我们最后通过正则返回的结果
  3. re正则findall查找全部r标识代表后面是正则的语句
  • 基本用法
  •  img
  • ^ 表示开头
  •  img
  • $ 表示结尾
  •  img
  • [...] 或
  •  img
  • d 返回0-9数字

注意结果不是连续的字符串

img

可以通过多个d 解决想要的长度

img

  • D 数字以外
  •  img
  • w 所有字母和数字,相当于[0-9a-zA-Z] img
  • W 和w相反,取特殊符号 img
  • .*取最大化内容
  •  img
  • 多个?,限制,匹配前一个字符1次或0次 img

** 三、mathch 和 search

re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。re.search 扫描整个字符串并返回第一个成功的匹配

img img

** 四、sub替换

sub用于替换字符串中的匹配项,语法一般是re.sub(r’正则匹配规则’,’替换的字符串’,需要检索的字符串)

img

'.'     默认匹配除
之外的任意一个字符,若指定flag DOTALL,则匹配任意字符,包括换行
'^'     匹配字符开头,若指定flags MULTILINE,这种也可以匹配上(r"^a","
abc
eee",flags=re.MULTILINE)
'$'     匹配字符结尾,或e.search("foo$","bfoo
sdfsf",flags=re.MULTILINE).group()也可以
'*'     匹配*号前的字符0次或多次,re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']
'+'     匹配前一个字符1次或多次,re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
'?'     匹配前一个字符1次或0次
'{m}'   匹配前一个字符m次
'{n,m}' 匹配前一个字符n到m次,re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
'|'     匹配|左或|右的字符,re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
'(...)' 分组匹配,re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c
 
 
'A'    只从字符开头匹配,re.search("Aabc","alexabc") 是匹配不到的
''    匹配字符结尾,同$
'd'    匹配数字0-9
'D'    匹配非数字
'w'    匹配[A-Za-z0-9]
'W'    匹配非[A-Za-z0-9]
's'     匹配空白字符、	、
、
 , re.search("s+","ab	c1
3").group() 结果 '	'
re.match 从头开始匹配
re.search 匹配包含
re.findall 把所有匹配到的字符放到以列表中的元素返回
re.splitall 以匹配到的字符当做列表分隔符
re.sub      匹配字符并替换
原文地址:https://www.cnblogs.com/xp1005/p/6496548.html