模块3 re + 正则表达式

1. 正则表达式 匹配字符串
元字符
. 除了换行
w 数字, 字母, 下划线
d 数字
s 空白符


 单词的边界
W 非xxx
D
S
[] 字符组
[^xxx] 非xxxx
^ 字符串的开始
$ 字符串的结束
| 或者
量词
* 0->n
+ 1->n
? 0->1
{p} p次
{p,q} p->q次
{p,} 至少p次

贪婪和惰性
.*
.+
惰性:
.*?宝宝 尽可能少的匹配

转义 \\n => \n =>
正则前面加r

分组 ()


2. 在python中使用正则. re
(?P<name>正则)
1. search() 搜索. 搜索到第一个结果返回
2. match() 匹配. 收到一个结果返回. 从头开始匹配
3. findall() 查找所有匹配结果
4. finditer() 返回迭代器.
5. compile() 编译
6. group("name") 获取数据
7. re.S 干掉 . 的换行


sub
subn
split
原文地址:https://www.cnblogs.com/YangWenYu-6/p/10209770.html