Python 正则表达式

原文链接:http://www.one2know.cn/python6/

简介

  • 正则表达式
    Regular Expression,简称RE

语法

  • 普通字符
    可打印字符 + 不可打印字符
    包括所有大写和小写字母,所有数字,所有标点符号以及一些其他符号
  • 非打印字符
字符 描述
cx Control+x,x属于[A-Z a-z]
f 换页符
换行符
s 任何空白字符,包括空格、制表符、换页符等,等价于[f v]
S 任何非空白字符
制表符
v 垂直制表符
回车符
  • 特殊字符
    放到匹配字符的后边,有特殊的含义,要相匹配他们要加反斜杠转义
字符 描述
$ 输入字符串的结尾位置,特殊的:
( ) 标记一个子表达式的开始和结束位置
* 前面的子表达式零次或多次
+ 前面的子表达式一次或多次
. 除换行符 之外的任何单字符
[ ] 标记一个中括号表达式
? 前面的子表达式零次或一次,非贪婪的,尽可能匹配短的
转义
^ 输入字符串的开始位,特殊的:
{ } 限定符表达式的开始
| 指明两项之间的一个选择
  • 限定符
    指定正则表达式的一个给定组件必须要出现多少次才能满足匹配
字符 描述
* 前面的子表达式零次或多次
+ 前面的子表达式一次或多次
? 前面的子表达式零次或一次
{n} 匹配确定的 n 次
{n,} 至少匹配n 次
{n,m} 最少匹配 n 次且最多匹配 m 次
  • 定位符
字符 描述
^ 输入字符串的开始位,特殊的:
$ 输入字符串的结尾位置,特殊的:
 匹配一个单词边界,即字与空格间的位置
B 非单词边界匹配

其他的元字符

字符 描述
(pattern) 匹配 pattern 并获取这一匹配
(?:pattern) 匹配 pattern 但不获取匹配结果
(?=pattern) 正向肯定预查
(?!pattern) 正向否定预查
(?<=pattern) 反向肯定预查,与正向肯定预查类似,只是方向相反
(?<!pattern) 反向否定预查,与正向否定预查类似,只是方向相反
x y
[xyz] 字符集合,匹配所包含的任意一个字符
[^xyz 负值字符集合,匹配未包含的任意字符
[a-z] 字符范围,匹配指定范围内的任意字符
[^a-z] 负值字符范围,匹配任何不在指定范围内的任意字符
d 匹配一个数字字符,等价于 [0-9]
D 匹配一个非数字字符,等价于 [^0-9]
w 匹配字母、数字、下划线。、,等价于 [A-Za-z0-9_]
W 与w相反,等价于 [^A-Za-z0-9_]
um 匹配num个,其中 num 是一个正整数,对所获取的匹配的引用。如,'(.)1' 匹配两个连续的相同字符。

运算符优先级

优先级相同的从左到右运算

运算符 描述
转义符
()[] 括号
* , +, ?, {n}, {n,}, {n,m} 限定符
^, $, 任何元字符、任何字符 位置和序列
|

常用表达式

数字

字符

其他


原文地址:https://www.cnblogs.com/peng8098/p/python_basis_6.html