Python学习第二阶段Day2，模块subprocess、 logging、re

1、logging

日志开关，设置全局只打印什么级别的日子，默认是warning以下的都不打印

改默认级别：依次升高

logging.debug("")

logging.info("")

logging.warning("")

logging.error("")

logging.critical("")

看当前日志级别

输出到文件里：

logging.basicConfig(filename="app.log", level=logging.DEBUG)

#DEBUG以上的都输出了，再执行就往后追加，改成warning后，包含warning和以上级别的输出

缺少时间啊，下面加上时间

logging.basicConfig(filename="app.log", level=logging.DEBUG,format='%(asctime)s-%(message)s',datefmt='%Y-%m-%d %H:%M:%S')

输出：

2017-07-28 22:40:37-内容

时间至少一个套路，还有很多套路：见套路表：

日志格式

%(name)s	Logger的名字
%(levelno)s	数字形式的日志级别
%(levelname)s	文本形式的日志级别
%(pathname)s	调用日志输出函数的模块的完整路径名，可能没有
%(filename)s	调用日志输出函数的模块的文件名
%(module)s	调用日志输出函数的模块名
%(funcName)s	调用日志输出函数的函数名
%(lineno)d	调用日志输出函数的语句所在的代码行
%(created)f	当前时间，用UNIX标准的表示时间的浮点数表示
%(relativeCreated)d	输出日志信息时的，自Logger创建以来的毫秒数
%(asctime)s	字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d	线程ID。可能没有
%(threadName)s	线程名。可能没有
%(process)d	进程ID。可能没有
%(message)s	用户输出的消息

可以打印时间，am pm模块名，行号，函数名，错误级别，进程号，线程号等

-------------------------------需求来了-------想要日志即在屏幕上又在文件里同时输出怎么办——？

Python提供四个类关于日志的

logger类，提供应用程序可以直接使用的接口，用户直接调用这个接口

handler类：将logger创建的日志输出到哪里？将logger创建的日志发屏幕，或者记录，或者远程机器或者邮件

filter类：过滤包含什么字段怎么发，复杂用的比较少

formatter：决定日志记录的最终输出格式

会用到三个类

输出信息前获得一个logger，通常一个模块对应一个logger

LOG = logging.getLogger("chat.gui") 例如chat.gui为名字

自己起个名字，MySQL或者ngix 都有两个日志，分别由两个logger输出。分门别类的输出文件

Logger.setLevel()设置级别，最低级别，低于该级别被忽略

addfilter()不说了

addhandler() 通过logger记录一条日志，添加handler到logger通过几个handler，就同时发到几个地方

几个handler：-------》

1.StreamHandler 屏幕.使用这个Handler可以向类似与sys.stdout或者sys.stderr的任何文件对象(file object)输出信息。它的构造函数是：StreamHandler([strm])其中strm参数是一个文件对象。默认是sys.stderr

2.FileHandler 文件

每个handler可以分别设置级别

Handler.setLevel() Handler.setFormatter() Handler.addFilter() Handler.remove...

定义日志格式Format

可以定义不同的文件格式，文件可以和屏幕不一样

ch = logging.formatter("asdfasdfasdf")

formater 跟handler关联

hdler.setFormatter(ch)

吧handler告诉logging

logger.addHandler(hdler)

这样子，就实现了日志记录目的地的多样性，和输出格式的多样性

先getlogger，屏幕，文件handler，再定义两种格式，格式跟handler绑定，再把handler跟logger绑定。

import logging

# logging.basicConfig(filename="aaaaa.log",
#                     level=logging.CRITICAL,
#                     format='%(asctime)s-%(levelname)s : %(message)s',
#                     datefmt='%Y-%m-%d %H:%M:%S')
# # level low to top
# logging.debug("!!!!!debug")
# logging.info("!!!!info")
# logging.warning("!!!!warning")
# logging.error("!!!!error")
# logging.critical("!!!!!!")

# ---- 在屏幕和文件中输出------------------
log1 = logging.getLogger("logger1")  # 名为logger1的log1对象
log1.setLevel(logging.DEBUG)

had1 = logging.StreamHandler()       # 屏幕和级别
had1.setLevel(logging.INFO)

had2 = logging.FileHandler("had2.log", encoding="utf-8") # 文件和级别
had2.setLevel(logging.WARN)

fm1 = logging.Formatter('%(asctime)s-%(levelname)s : %(message)s') #格式1
fm2 = logging.Formatter('%(levelname)s : %(message)s')             # 格式2

had1.setFormatter(fm1)  #绑定formatter
had2.setFormatter(fm2)

log1.addHandler(had1)   #添加handler
log1.addHandler(had2)

log1.info("aaaa")
log1.warning("哈哈哈")

# 屏幕：
# 2017-07-28 23:11:02,946-INFO : aaaa
# 2017-07-28 23:11:02,946-WARNING : 哈哈哈
# 文件：
# WARNING : 哈哈哈

再讲一点。

网站访问量大，日志很多几个G，有时候需要写脚本切割，有的程序可以自动切割

咱的logger里可以根据时间和大小进行切割

RotatingFileHandler管理文件大小，达到一定大小改名，依次创建文件。maxBytes指定文件大小

backupCount用于保留日志文件的个数

文件自动截断例子按大小

logging.handlers.RotatingFileHandler(filename="dfa",maxBytes=1,backupCount=3,encoding="utf8")

一共出现四个log,备份三个，显示最新的，把之前的删了，只保留3个

文件自动截断按时间：S 秒 M分 H小时 D天 W每星期 midnight每天凌晨

handlers.TimedRotatingFileHandler(filename="ds",when="S",interval=5,backupCount=3,encoding="utf8")

5秒截断

from logging import handlers
log1 = logging.getLogger("name1")
hand1 = logging.handlers.RotatingFileHandler(filename="fffff.log",
                                             maxBytes=1,
                                             backupCount=3,
                                             encoding="utf-8")
# hand1 = logging.handlers.TimedRotatingFileHandler(filename="fffff.log",
#                                                   when='s',
#                                                   interval=1,
#                                                   backupCount=3)
log1.addHandler(hand1)
log1.warning("a")
log1.warning("b")

2.re模块

[+-]{2,} 和 (+|-){2,} 一样的

[+-]{0,1} 和 (+|-)? 一样的

正则表达式，匹配 “不全是空格” 怎么写？答案： .*[^ ].*

re.match 从头开始匹配 match(pattern, string, flags=0)

re.search 匹配包含 search(pattern, string, flags=0)

re.findall 把所有匹配到的字符放到以列表中的元素返回 findall(pattern, string, flags=0)

re.split 以匹配到的字符当做列表分隔符 split(pattern, string, maxsplit=0, flags=0)

re.sub 匹配字符并替换

sub(pattern, repl, string, count=0, flags=0)
   “d+”   "A"   "asdfadfa"  次数    


flags = re.I
flags = re.M

re.I(re.IGNORECASE): 忽略大小写（括号内是完整写法，下同）

M(MULTILINE): 多行模式，改变'^'和'$'的行为（参见上图）

S(DOTALL): 点任意匹配模式，改变'.'的行为

re.split 套路：

import re

str1 = '123 S 456 S 789 S abc S def'

print(re.split('S', str1, maxsplit=0)) #['123 ', ' 456 ', ' 789 ', ' abc ', ' def']
print(re.split('S', str1, maxsplit=1)) #['123 ', ' 456 S 789 S abc S def']
print(re.split('S', str1, maxsplit=2)) #['123 ', ' 456 ', ' 789 S abc S def']
print(re.split('S', str1, maxsplit=3)) #['123 ', ' 456 ', ' 789 ', ' abc S def']
print(re.split('S', str1, maxsplit=4)) #['123 ', ' 456 ', ' 789 ', ' abc ', ' def']
print(re.split('S', str1, maxsplit=5)) #['123 ', ' 456 ', ' 789 ', ' abc ', ' def']

用的场景，经常做文字处理用的比较多，做字符串匹配的

精确匹配模糊匹配

最基本的匹配：

import re

re.match("inet", "inet 1123sdfasdf")

match是从头开始匹配

匹配不上返回NONE

匹配上了返回<_sre.SRE_Match object; span=(0,4), match='inet'>

通过a.group()可以看到匹配到了哪些字段，动态规则可以看到很多

先看套路：

'.'     默认匹配除
之外的任意一个字符，若指定flag DOTALL,则匹配任意字符，包括换行
'^'     匹配字符开头，若指定flags MULTILINE,这种也可以匹配上(r"^a","
abc
eee",flags=re.MULTILINE)
'$'     匹配字符结尾，或e.search("foo$","bfoo
sdfsf",flags=re.MULTILINE).group()也可以
'*'     匹配*号前的字符0次或多次，re.findall("ab*","cabb3abcbbac")  结果为['abb', 'ab', 'a']
'+'     匹配前一个字符1次或多次，re.findall("ab+","ab+cd+abb+bba") 结果['ab', 'abb']
'?'     匹配前一个字符1次或0次
'{m}'   匹配前一个字符m次
'{n,m}' 匹配前一个字符n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 结果'abb', 'ab', 'abb']
'|'     匹配|左或|右的字符，re.search("abc|ABC","ABCBabcCD").group() 结果'ABC'
'(...)' 分组匹配，re.search("(abc){2}a(123|456)c", "abcabca456c").group() 结果 abcabca456c
 
 
'A'    只从字符开头匹配，re.search("Aabc","alexabc") 是匹配不到的
''    匹配字符结尾，同$
'd'    匹配数字0-9
'D'    匹配非数字
'w'    匹配[A-Za-z0-9]
'W'    匹配非[A-Za-z0-9]
's'     匹配空白字符、	、
、
 , re.search("s+","ab	c1
3").group() 结果 '	'

'S'     匹配非空白字符、

'(?P<name>...)' 分组匹配 re.search("(?P<province>[0-9]{4})(?P<city>[0-9]{2})(?P<birthday>[0-9]{4})","371481199306143242").groupdict("city") 结果{'province': '3714', 'city': '81', 'birthday': '1993'}

re.search整个里面去搜