python基础---2day

正则表达式基础

  1、元字符

  2、限定符

   3、字符类

  要想匹配包含某些字符可以使用[],如“[a-z0-9A-Z]”

  4、排查字符

  可以使用[^a-zA-Z]

  5、选择字符

  可以通过(|)来实现,如匹配身份证号码:(^d{15}$)|(^d{18}$)|(^d{17})(d|X|x)$

  6、转义字符

  正则表达式中的转义字符()和python中的大同小异,都是将特殊字符(如“,”?""等)变为普通的字符。举一个IP地址的实例,用正则表达式匹配诸如“127.0.0.1”这样格式的IP地址。

  [1-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}

  7、分组

  (six|four)th,用来匹配sixth或是fourth.

  对如上ip地址匹配语句可以优化为:[1-9]{1,3}(.[0-9]{1,3}){3}

使用re模块实现正则表达式操作

  1、使用match()方法进行匹配

  match()方法用于从字符串的开始进行匹配,如果在起始位置配置成功,则返回Match对象,否则返回None,语法格式如下:

re.match(pattern,string,[flags])

  参数说明:

  pattern:表示模式字符串,由要匹配的正则表达式转换而来

  string:表示要匹配的字符串

  flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写,常用标志如下:

   例如,匹配字符串是否以“mr_”开头,不区分字母大小写,代码如下

   match对象中包含了匹配值的位置和匹配数据。其中,要获取匹配值的起始位置可以使用match对象的start()方法;要获取匹配值的结束位置可以使用end()方法;通过span()方法可以返回匹配位置的元组;通过string属性可以获取要匹配的字符串。如下代码

 

   2、使用search()方法进行匹配

  search()方法用于在整个字符串中搜索第一个匹配的值,如果匹配成功,则返回match对象,否则返回None,语法格式如下: 

re.search(pattern,string,[flags])

  参数说明:

  pattern:表示模式字符串,由要匹配的正则表达式转换而来

  string:表示要匹配的字符串。

  flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

例如:搜索第一个以“mr_”开头的字符串,不区分字母大小写,代码如下:

   3、使用findall()方法进行匹配

  findall()方法用于在整个字符串中搜索所有符合正则表达式的字符串,并以列表的形式返回。如果匹配成功,则返回包含匹配结构的列表,否则返回空列表。语法格式:

re.findall(pattern,string,[flags])

参数说明:

  pattern:表示模式字符串,由要匹配的正则表达式转换而来

  string:表示要匹配的字符串。

  flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

  例如:搜索以"mr_"开头的字符串,代码如下:

 如果在指定的模式字符串中,包含分组,则返回与分组匹配的文本列表。例如

   4、替换字符串

  sub()方法用于实现字符串替换,语法格式如下:

re.sub(pattern,repl,string,count,flags)

  参数说明:

  pattern:表示模式字符串,由要匹配的正则表达式转换而来

  repl:表示替换的字符串

  string:表示要被查找替换的原始字符串

  count:可选参数,表示模式匹配后替换的最大次数,默认值为0,表示替换所有的匹配。

  flags:可选参数,表示标志位,用于控制匹配方式,如是否区分字母大小写。

   5、使用正则表达式分割字符串

  split()方法用于实现根据正则表达式分割字符串,并以列表的形式返回,其作用与字符串对象的split()方法类似,所不同的就是分割字符由模式字符串指定。语法格式如下:

re.split(pattern,string,[maxsplit],[flags])

  

原文地址:https://www.cnblogs.com/weidongliu/p/12017738.html