1、基础知识
什么是正则表达式?
一种匹配字符串的规则
应用领域
自动化开发、数据分析 爬虫 注册页面的表单验证、web开发
2、正则表达式的语法
元字符
字符组[ ] [^] 除了 | 或 () 分组
在一个字符位置上能出现的内容
[0-9][a-z][A-Z] 匹配三个字符
[abc0-9] 匹配一个字符
[0-9a-zA-Z] 匹配一个字符
d 表示匹配的一个字符,匹配数字
w 表示匹配数字字母下划线
s 表示匹配 空格、换行符、制表符
D 表示匹配非数字的字符
W 表示匹配非数字字母下划线
S 表示匹配非空白(制表符、换行符、空格)
[dD] [wW] [sS] 匹配所有
量词
? 表示重复0次或1次
+ 表示重复1次或多次
* 表示重复0次或多次
{n} {n,} {n,m}
d+(.d+)? 小数或整数
特殊的用法和现象
1、在量词的后面跟了一个 ?表示取消贪婪匹配 非贪婪(惰性)模式 回溯算法
??+? *? {n}?
{1,3}?取消贪婪模式
.*?x 最常用 匹配任意字符直到找到x
李.{1,3}?和 李连英和
帮助学习的工具 http://tool.chinaz.com/regex/