python 正则表达式 re.match

 1 #coding:utf-8
 2 
 3 import re
 4 #匹配内容：单词+空格+单词+任意字符
 5 #w 单词字符[A-Za-z0-9_]
 6 #(?P<name>...) 分组，除了原有的编号外在指定一个额外的别名
 7 # * 匹配前一个字符0或无限次 
 8 m=re.match(r'(w+) (w+)(?P<sign>.*)','whoami ufo')
 9 
10 #string: 匹配时使用的文本。
11 print 'm.string :',m.string
12 #re: 匹配时使用的Pattern对象
13 print 'm.re :',m.re
14 #pos: 文本中正则表达式开始搜索的索引。值与Pattern.match()
15 # 和Pattern.seach()方法的同名参数相同。
16 print 'm.pos :',m.pos
17 #endpos: 文本中正则表达式结束搜索的索引。值与Pattern.match()
18 # 和Pattern.seach()方法的同名参数相同。
19 print 'm.endpos :',m.endpos
20 #lastindex: 最后一个被捕获的分组在文本中的索引。
21 # 如果没有被捕获的分组，将为None。
22 print 'm.lastindex :',m.lastindex
23 #lastgroup: 最后一个被捕获的分组的别名。
24 # 如果这个分组没有别名或者没有被捕获的分组，将为None。
25 print 'm.lastgroup :',m.lastgroup
26 #.group([group1, …]):获得一个或多个分组截获的字符串；
27 # 指定多个参数时将以元组形式返回。group1可以使用编号也可以使用别名；
28 # 编号0代表整个匹配的子串；不填写参数时，返回group(0)；
29 # 没有截获字符串的组返回None；截获了多次的组返回最后一次截获的子串。
30 print 'm.group() :',m.group()
31 print 'm.group(1,2)  :',m.group(1,2)
32 print 'm.group(1, 2) :',m.group(1, 2)
33 #groups([default]):以元组形式返回全部分组截获的字符串。
34 # 相当于调用group(1,2,…last)。default表示没有截获字符串的组以这个
35 # 值替代，默认为None。
36 print 'm.groups() :',m.groups()
37 print 'm.groups(3) :',m.groups(3)
38 #groupdict([default]):返回以有别名的组的别名为键、以该组截获的子串
39 # 为值的字典，没有别名的组不包含在内。default含义同上。
40 print 'm.groupdict() :',m.groupdict()
41 #start([group]):返回指定的组截获的子串在string中的起始索引
42 #（子串第一个字符的索引）。group默认值为0。
43 print 'm.start(2) :',m.start(2)
44 print 'm.start(3) :',m.start(3)
45 #end([group]):返回指定的组截获的子串在string中的结束索引
46 #（子串最后一个字符的索引+1）。group默认值为0。
47 print 'm.end(2) :',m.end(2)
48 print 'm.end(3) :',m.end(3)
49 #span([group]):返回(start(group), end(group))。
50 print 'm.span(1) :',m.span(1)
51 print 'm.span(2) :',m.span(2)
52 #expand(template):将匹配到的分组代入template中然后返回。
53 # template中可以使用id或g、g引用分组，但不能使用编号0。
54 # id与g是等价的；但10将被认为是第10个分组，如果你想表达1之后是字符’0’，
55 # 只能使用g0。
56 print r"m.expand(r'g') 1:",m.expand(r'1')
57 print r"m.expand(r'g') 2:",m.expand(r'2')
58 print r"m.expand(r'g') 3:",m.expand(r'3')
59 
60 print r"m.expand(r'g gg') :",m.expand(r'2 22')
61 print r"m.expand(r'g gg') :",m.expand(r'2 13')

Output:

 1 m.string : whoami ufo
 2 m.re : <_sre.SRE_Pattern object at 0x0000000002591140>    #这里与原文不同，猜测：返回值为pattern对象的存储位置
 3 m.pos : 0
 4 m.endpos : 10
 5 m.lastindex : 3
 6 m.lastgroup : sign
 7 m.group() : whoami ufo
 8 m.group(1,2)  : ('whoami', 'ufo')    
 9 m.group(1, 2) : ('whoami', 'ufo')    #测试，空格无作用
10 m.groups() : ('whoami', 'ufo', '')
11 m.groups(3) : ('whoami', 'ufo', '')    #传入任意参数，结果相同
12 m.groupdict() : {'sign': ''}
13 m.start(2) : 7
14 m.start(3) : 10
15 m.end(2) : 10
16 m.end(3) : 10
17 m.span(1) : (0, 6)
18 m.span(2) : (7, 10)
19 m.expand(r'g') 1: whoami
20 m.expand(r'g') 2: ufo
21 m.expand(r'g') 3: 
22 m.expand(r'g gg') : ufo ufoufo
23 m.expand(r'g gg') : ufo whoami

quote:http://cuiqingcai.com/977.html