python re.findall 使用

 1 import re
 2 
 3 #w 匹配字母数字及下划线
 4 print(re.findall('w','hello alan _god !@^&#^$^!*&(*'))
 5 
 6 #W 匹配非字母数字下划线
 7 print(re.findall('W','hello alan _god !#@!#$(#*'))
 8 #s 匹配空白字符
 9 print(re.findall('s',"alan and god *& YUN CHINA"))
10 #S  匹配非空白字符
11 print(re.findall('S',"alan and god *& YUN CHINA"))
12 #d 数字与 D 非数字
13 print(re.findall('d',"2018年9月8日16:54:30alan and god *& YUN CHINA1949"))
14 print(re.findall('D',"20182018年9月8日16:54:20alan and god *& YUN CHINA1949"))
15 
16 #A 匹配字符串开始
17 print(re.findall('ACH',"CH2018年9月8日16:54:30alan and god *& YUN CHINA1949"))
18 # 匹配字符串结束
19 print(re.findall('Z',"20182018年9月8日16:54:20alan and god *& YUN CHINA1949ZZ"))
20 
21 #^ 字符串开头 与 $字符串结尾
22 
23 print(re.findall('^a',"alan and god *& YUN CHINA"))
24 print(re.findall('NA$','alan and god *& YUN CHINA'))
25 #.  匹配任意
26 print(re.findall('an.','alan and angod *& YUN CHINA'))
27 print(re.findall('a.a','a a alan and a&a ata aa'))
28 
29 #* 匹配0或多个
30 print(re.findall('an*','a a alan and god  anSB anang *& YUN CHINA'))
31 print(re.findall('an*','alan and a&a ata a a'))
32 
33 #？ 匹配0或1------------------------
34 print(re.findall('ag?','age avg agre amg a'))
35 print(re.findall('agg?','aggge avgagg aggre amg ag'))
36 
37 #匹配所有包含小数在内的数字
38 print(re.findall('d+.?d*','123adf 1.33663fsdf13fsdf1fsdf3'))
39 
40 #.*默认为贪婪匹配
41 print(re.findall('a.*d','adss andgod930 axds9kidg'))
42 
43 #.*?为非贪婪匹配
44 print(re.findall('a.*?d','andgod930 axds9kidg ad aa'))
45 
46 #+ 1或多
47 print(re.findall('and+','andgod930 axds9kidg an and anddd andddSSS'))
48 
49 #{n,m}  >=n，<m
50 print(re.findall('an{2}','andgod930 axds9kidg an annd anndd anddd andddSSS'))
51 print(re.findall('an{1,3}','andgod930 axds9kidg an annd anndd anddd andddSSS'))
52 print(re.findall('ab{1,}','abbb abs a ab bb'))
53 print(re.findall('ab{0,}','abbb abs a ab bb abb'))
54 
55 #[]内的都为普通字符了，且如果-没有被转意的话，应该放到[]的开头或结尾
56 print(re.findall('a[1*-]b','a1b a*b a-b asb aab allb a--b'))
57 
58 #[]内的^代表的意思是取反
59 print(re.findall('a[^1*-]b','a1b a*b a-b a=b'))
60 
61 #[]内的0-9 之间匹配 0到9 之间的整数
62 print(re.findall('a[0-9]b','a1b a*b a-b a=b a0b a00b '))
63 
64 #[]内的a-z 之间匹配 小写字母
65 print(re.findall('a[a-z]b','a1b a*b A-D a-b a=b aeb aAb abb acb azb'))
66 
67 #[]内的A-Z 之间匹配 大写字母
68 print(re.findall('[A-Z]','a1b a*b A-D a-b a=b aeb aAb abb acb azb'))
69 
70 #[]内的a-z 或者 A-Z 之间匹配 大写字母 与小写字母
71 print(re.findall('a[a-zA-Z]b','a1b a*b a-b a=b aeb aEb aab aAb aZb azb'))
72 
73 
74 # 与  与 \
75 
76 #对于正则来说a\c确实可以匹配到ac,但是在python解释器读取a\c时，会发生转义，然后交给re去执行，所以抛出异常
77 print(re.findall('a\c','ac')) 
78 #r代表告诉解释器使用rawstring，即原生字符串，把我们正则内的所有符号都当普通字符处理，不要转义
79 print(re.findall(r'a\c','ac a\c a c ac'))
80 #和上面的结果一样
81 print(re.findall('a\\c','ac a\c '))
82 
83 #() 分組
84 print(re.findall('ab+','ababab123 abc abd'))
85 
86 #匹配到末尾的ab123中的ab
87 print(re.findall('(ab)+123','abab123 abc123 abb123 aa1234 ab1234'))
88 
89 #findall的结果不是匹配的全部内容，而是组内的内容,?:可以让结果为匹配的全部内容
90 print(re.findall('(?:ab)+123','ababab123 abc123 abb123 aa1234 ab1234'))
91 
92 print(re.findall('href="(.*?)"','<a href="http://www.baidu.com">百度</a> <a href="http://www.google.com">go</a> <a href="http://www.yunhua.com">go</a>'))
93 
94 print(re.findall('href="(?:.*?)"','<a href="http://www.baidu.com">百度</a> <a href="http://www.google.com">go</a> <a href="http://www.yunhua.com">go</a>'))