Python学习笔模式匹配与正则表达式之管理复杂的正则表达式

随笔记录方便自己和同路人查阅。

#------------------------------------------------我是可耻的分割线-------------------------------------------

  如果要匹配的文本模式很简单,正则表达式就很好。但匹配复杂的文本模式,可能需要长的、费解的正则表达式。

你可以告诉 re.compile(),忽略正则表达式字符串中的空白符和注释,从而缓解这一点。要实现这种详细模式,可以向

re.compile()传入变量 re.VERBOSE,作为第二个参数。

#------------------------------------------------我是可耻的分割线-------------------------------------------

  示例代码:

#! python 3
# -*- coding:utf-8 -*-
# Autor: Li Rong Yang
import re
#未使用re.VERBOSE方法
agentNamesRegex = re.compile(r'((d{3}|(d{3}))?(s|-|.)?d{3}(s|-|.)d{4}(s*(ext|x|ext.)s*d{2,5})?)')
#使用re.VERBOSE方法
phoneRegex = re.compile(r'''(
                        (d{3}|(d{3}))? # area code
                        (s|-|.)? # separator
                        d{3} # first 3 digits
                        (s|-|.) # separator
                        d{4} # last 4 digits
                        (s*(ext|x|ext.)s*d{2,5})? # extension
                        )''',re.VERBOSE)

  根据代码可以看出,不使用re.VERBOSE时只能在一行中写,但如果正则表达式太复杂,会影响阅读。而使用re.VERBOSE则可以多行分开写一行写一种正则表达式。

原文地址:https://www.cnblogs.com/lirongyang/p/9588624.html