python爬虫(二十二) 正则表达式匹配多个字符

一、1、* :匹配0个或者任意多个字符

text="1234"
ret=re.match('d*',text)
print(ret.group())
>>1234

2、+:匹配一个或多个字符

text="abcd"
ret=re.match('w+',text)
print(ret.group())
>>abcd

3、?:匹配0个或者1个字符

text="abcd"
ret=re.match('w?',text)
print(ret.group())
>>a

4、{m}:匹配m个字符

text="abcd"
ret=re.match('w{2}',text)
print(ret.group())
>>ab

5、{m,n}:匹配m到n个字符

text="abcd"
ret=re.match('w{1,5}',text)  //匹配一个、两个、三个到五个都行
print(ret.group())
>>abcd

二、验证手机号

text="180123456789"
ret=re.match('1[34578]d{9}',text)
print(ret.group())
>>180123456789

三、验证邮箱

text="2605072149@qq.com"
ret=re.match('w+@[a-z0-9]+.[a-z]+',text)
print(ret.group())
>>2605072149@qq.com

四、验证url

text="https://baike.baidu.com/item/Python/407313?fr=aladdin"
ret=re.match('(http|https|ftp)://[^s]+',text)
print(ret.group())

 五、验证身份证

text="311111222222111445"
ret=re.match('d{17}[dxX]',text)
print(ret.group())

原文地址:https://www.cnblogs.com/zhaoxinhui/p/12468387.html