day24 模块03_re

休养生息 --模块03

1.正则表达式

2.在python中使用正则.re

一,正则表达式 (匹配字符串,主要是给字符串使用的)

1)元字符

.  除换行符之外

w 数字,字母,下划线组成   W 非数字,字母,下划线组成

d 数字    D 非数字

s 空白符    S  非空白符

Enter ,换行符

Tab

 以xxx结尾

[] 字符组

[^xxx] 非xxx

^x 以x开头

x$ 以x结尾

a|b  a或者b 

2) 量词

* [0,无穷)

+ [1,无穷)

?[0,1]

{n} 出现n次

{n,} 最少出现n次

{n,m} 出现[n,m]次

3)贪婪和惰性匹配

贪婪匹配:

  .*x尽可能多的从[0,无穷]取值,但结尾必须是x

  .+x尽可能多的从[1,无穷]取值,但结尾必须是x

惰性匹配

  .*?x 尽可能少的取到x,但是末尾必须是x

转义 : \n -->   (正则前面要加r)

分组 :()

二 .在Python中使用正则.re

import re

1).re.findall('','内容')从内容中查找所有的符合要求的东西

2).re.finditer('','内容') 从内容中返回迭代器

3).re.match('','内容')从内容中找到结果返回,必须是从头开始匹配

4).re.seatch('','内容')从内容中找到结果返回,找到一个结果后就返回

5).compile() 编译

6).group() 获取数据内容

7).re.S 去掉.中的换行符,(.变成了可以匹配所有的数据)

原文地址:https://www.cnblogs.com/zty1304368100/p/10192510.html