第四章 使用元字符

元字符大概可以分为2类:
(1)用来匹配文本的
(2)正则表达式的语法所要求的。
 
空白元字符
 
元字符
说明
[]
回退(并删除)一个字符(Backspace键)
f
换页符
换行符
回车符
制表符(Tab键)
v
垂直制表符
 
Windows所使用的文本行结束标签 。一般使用两个 匹配两条记录之间的空白行
Linux/Unix系统上匹配空白行只使用 即可
 
同时适用Windows和Linux/Unix的正则表达式:[ ]?[ ]?[ ]
 
 
数字元字符
 
元字符
说明
d
任何一个数字字符(等价于[0-9])
D
任何一个非数字字符(等价于[^0-9])
 
 
字母数字元字符
 
元字符
说明
w
任何一个字母数字字符(大小写均可)或下划线字符(等价于[a-zA-Z0-9_])
W
任何一个非字母数字或非下划线字符(等价于[^a-zA-Z0-9_])
 
 
空白字符元字符
 
元字符
说明
s
任何一个空白字符(等价于[f v])
S
任何一个非空白字符(等价于[^f v])
 
 
 
在正则表达式里,十六进制数值要用前缀x给出。如x0A
在正则表达式里,八进制数值要用前缀给出。如11
 
 
使用POSIX字符类:
使用POSIX字符类的模式以[[开头,以]]结尾。POSIX字符类必须扩在[:和:]之间。如[:xdigit:]
 
 
用来进行大小写转化的元字符
 
 
元字符
说明
E
结束L或U转换
l
把下一个字符转化为小写
L
把L到E之间的字符全部转换为小写
u
把下一个字符转换为大写
U
把U到E之间的字符全部转换为大写
 
 
 
 
 
 
 

原文地址:https://www.cnblogs.com/mumulin99/p/9838530.html