正则表达式

1.通配符

.能够匹配任意字符

2.特殊字符转义

例如想要匹配baidu.com的正确做法应该讲正则表达式写成baidu//.com

3.字符集

[a-z]表示能匹配a到z之间的字母[a-z0-9]表示能匹配小写字母和数字

翻转字符集就是在之前加上^,[^abc]表示能匹配除了abc之外的字符

4.选择符

只想匹配两"abc"和"ade"两个字符串可以写成'abc|ade'

5.子模式

前例可以写成a(ba|de)

在子模式后面加上问号,它就变成了可选项。它可能出现在匹配字符串,但并非必须的。

5.可选项

对子模式后面加?就变成了可选项

r’(heep://)?(www.)?python.org’

只能匹配下列字符:

‘http://www.python.org’

‘http://python.org’

‘www.python.org’

‘python.org’

6.重复子模式

(pattern)* : 允许模式重复0次或多次

(pattern)+ : 允许模式重复1次或多次

(pattern){m,n} : 允许模式重复m~ n 次

例如:

r’w * .python.org’  匹配 ‘www.python.org’ 、’.python.org’ 、’wwwwwww.python.org’

r’w + .python.org’  匹配 ‘w.python.org’ ;但不能匹配 ’.python.org’ 

r’w {3,4}.python.org’  只能匹配‘www.python.org’ 和‘wwww.python.org’ 

 

原文地址:https://www.cnblogs.com/icodefive/p/5011122.html