Regular Expression

转译字符:

-->换行

-->制表符

\-->反斜杠

.-->表示匹配点

常用:

d-->数字0-9

D-->非数字

w-->单词字符(0-9A-Za-z_)及空白字符

s-->制表,换行,空格...等空白字符

S-->非空白字符

^-->开始位置

$--->结束位置

-->单词边界

g--->全局匹配

例子-->[a-k6c]---匹配a到k,6或者c中任意一个字符

[^9w]---去掉9w之外的字符串

[ok$]---以字母结尾的字符串

[d.-_+]----数字,点,-,+,_字符

量词(修饰次数)--->

{m}--->出现m次

{m,n}--->最少m次,最多n次

{m,}---->最少m次

?---->0到1次=={0,1}

+--->1到多次=={1,}

*--->0到多次=={0,}

分组及选择符-->

|--->或者

()--->分组序号1,2...(捕获)

(?:expression)--->非捕获expression

(?=expression)--->断言自身后面出现expression

(?<=expression)--->断言自身前面出现expression

(?!expression)--->断言自身后面不出现expression

(?<!expression)--->断言自身前面不出现expression

贪婪模式是匹配越多越好(默认)

非贪婪模式尽量少的匹配(表达式后面加上?)

练习--->

0d{2,3}-d{7,8}---->027-89378978

1[3,5,8,7,9]/d{9}--->15988888899

[w-]+@[a-z0-9]+(.[A-Za-z]{2,3}){1,2}-->67838@qq.com, andy@sina.com.cn

[u4e00-u9fa5]---->中文

s* ---->空白行

<(S*?)[^>]*>.*?</1>|<.*?/>----->html标记
---------------------


作者:Do_It_Possible
来源:CSDN
原文:https://blog.csdn.net/github_39021422/article/details/73526344
版权声明:本文为博主原创文章,转载请附上博文链接!

原文地址:https://www.cnblogs.com/Yehudic/p/10139208.html