正则表达式

元字符
pip  Beautiful  Soup  美汤
import  re  导入
正则的功能:抓取,判断,过滤
 
.   就是匹配所有all 除了( )     转义(/.)用于中间有点的时候
[1-9]   [1,2,3]   [A,B,C]   [548932]   [9876543210]  匹配范围 区间
d 匹配所有数字0-9 
D 除去所有数字
w 匹配单词字符 a-z, A-Z ,0-9, 下划线       用于匹配邮箱
W 除去所有的字母数字 剩(#%)
s 匹配空白 即空格,tab键
S匹配非空白
str.strip()自动去除前后空格 
(163|QQ|) 配置表达式 | 是或者的意思
(?=  ) 向前查找
ret=re.match("^(?=.*[a-z])(?=.*[A-Z])(?=.*[0-9])[w]{6}$",password)
修饰元字符
greed 贪婪 *  +
lazy  懒惰   ?
^a 定制必须是以a开头的
a$ 定制必须以a结尾
[^a] 排除a
 
(1) 不是元组 是数字1
(1,) 元组必须有逗号
@qq163|QQ|
(163|QQ|) 配置表达式 | 是或者的意思
 import  re
 ret=re.match("163","163.com") ##163是想要找的内容 ,从163.com里找想要的内容
 
 print(ret.group())
 
match 是从头开始匹配 否则报错
str=" "
a= re.compile(" ")
print(a.findall(str))
 1 import re
 2 # 键盘录入
 3 n=input("请输入网址:")
 4 ret=re.match(r"^(https://www).[0-9a-zA-Z]+.(com)$",n)
 5 
 6 if ret:
 7     print("%s输入正确"%(ret.group()))
 8 
 9 else:
10     print("输入网址有误%s"%n)

# 匹配所有汉字
print(re.findall('[u4e00-u9fa5]', data))

# 匹配所有单字符,英文,数字,特殊符号
print(re.findall('[x00-xff]', data))

# 匹配所有非单字符,如汉字和省略号
print(re.findall('[^x00-xff]', data))
原文地址:https://www.cnblogs.com/sunzhiqi/p/10064858.html