#小练习 从多个文件中提取* 分类: python 小练习 正则表达式 20130528 15:40 442人阅读 评论(0) 收藏

import sys,glob,re,fileinput

pattern = r'(\d{3})\D*(\d{3})\D*(\d{4})\D*(\d*)$'

'''
测试数据:
800-555-1212
800 555 1212
800.555.1212
(800) 555-1212
1-800-555-1212
800-555-1212-1234
800-555-1212x1234
800-555-1212 ext. 1234
work 1-(800) 555.1212 #1234
'''
for line in fileinput.input(glob.glob(r'D:\test\*.txt')):#使用glob模块遍历txt文件,返回多个files
    line=line.strip()
    tag = re.search(pattern,line)

    if fileinput.isfirstline():#如果是文件第一行,输出文件名
        sys.stdout.write('--reading %s \n' % fileinput.filename())
    if tag:
        print fileinput.filelineno(),line,tag.groups()#找到匹配的内容,则输出行号、行数据、组


fileinput.close() #关闭这个内部对象



版权声明:本文为博主原创文章,未经博主允许不得转载。

原文地址:https://www.cnblogs.com/think1988/p/4628179.html