正则表达式:元字符 简

类别

元字符

描述

起、始、转义

^

匹配输入字符串的开始位置。

$

匹配输入字符串的结束位置。

\

将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。

个数匹配

*

匹配前面的子表达式零次或多次。

+

匹配前面的子表达式一次或多次。

?

匹配前面的子表达式零次或一次。

{n}

匹配确定的n次。

{n,}

至少匹配n次。

{n,m}

最少匹配n次且最多匹配m次。请注意在逗号和两个数之间不能有空格。

?

非贪婪的匹配模式,紧跟(*,+,?,{n},{n,},{n,m})后面。默认的贪婪模式。

字符集合

.

匹配除“\n”之外的任何单个字符。

(pattern)

匹配pattern并获取这一匹配。

x|y

匹配x或y。

[xyz]

匹配所包含的xyz任意一个字符。

[^xyz]

匹配未包含的非xyz任意字符。

[a-z]

匹配指定范围内的任意字符。

[^a-z]

匹配任何不在指定范围内的任意字符。

特定集合

\d

匹配一个数字字符。等价于[0-9]。

\D

匹配一个非数字字符。等价于[^0-9]。

\s

匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

\w

匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]”。

\W

匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。

字符边界
数字

\b

匹配一个单词边界,也就是指单词和空格间的位置。

\B

匹配非单词边界。

\num

匹配num,其中num是一个正整数。

特殊符号

\f

匹配一个换页符。等价于\x0c和\cL。

\n

匹配一个换行符。等价于\x0a和\cJ。

\r

匹配一个回车符。等价于\x0d和\cM。

\t

匹配一个制表符。等价于\x09和\cI。

\v

匹配一个垂直制表符。等价于\x0b和\cK。

其余进制匹配

\cx

匹配由x指明的控制字符。

\xn

匹配n,其中n为十六进制转义值。

\n

标识一个八进制转义值或一个向后引用。

\nm

标识一个八进制转义值或一个向后引用。

\nml

如果n为八进制数字(0-3),且m和l均为八进制数字(0-7),则匹配八进制转义值nml。

\un

匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。

非获取匹配

(?:pattern)

匹配pattern但不获取匹配结果。

(?=pattern)

正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,

(?!pattern)

正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串。

(?<=pattern)

反向肯定预查,与正向肯定预查类似,只是方向相反

(?<!pattern)

反向否定预查,与正向否定预查类似,只是方向相反。

原文地址:https://www.cnblogs.com/olmlo/p/3099497.html