常用模块（Day25-Day28）

模块分为三种：
1.内置模块：python安装时自带的。

2.扩展模块：别人写的，需要安装之后可以直接使用，如django,tornado等。

3.自定义模块：自己写的模块。

序列化模块

序列指字符串，序列化就是将字典、列表转换成字符串的过程。

1.json模块 所有编程语言通用，支持的数据类型有限，只支持数字、字符串、序列、字典，不支持除了str数据类型之外key，json中所有字符串都用双引号“”。

功能：

1）dumps和loads 在内存中操作数据，用于网络传输和多个字典。

dumps 序列化：数据转换成字符串。

loads 反序列化：字符串转回原数据类型。

import json
dict = {'name':'yuan','age':18}
ret = json.dumps(dict)
print(type(ret),ret) #<class 'str'> {"name": "yuan", "age": 18}

res = json.loads(ret)
print(type(res),res) #<class 'dict'> {'name': 'yuan', 'age': 18}

dict1 = {'name':'yuan','age':18}
dict2 = {'name':'alex','age':20}
dict3 = {'name':'jin','age':25}
f = open('log1','a',encoding='utf-8')
str1 = json.dumps(dict1)
f.write(str1+'
')
str2 = json.dumps(dict2)
f.write(str2+'
')
str3 = json.dumps(dict3)
f.write(str3+'
')
f.close()

f = open('log1','r',encoding='utf-8')
for i in f:
    print(json.loads(i.strip()))
f.close()

2）dump 和 load 在文件中操作数据，用于一个数据直接存在文件里

dump ：数据写入文件。

load：文件中的字符串转换成数据读出。

dict = {'name':'yuan','age':18}
f = open('log','w',encoding='utf-8')
json.dump(dict,f)
f.close()

with open('log','r',encoding='utf-8') as f:
    ret = json.load(f)
    print(ret)

2.pickle模块 只能在python语言的程序之间传递数据，支持python的所有数据类型，序列化结果是bytes类型。

dumps,loads,dump,load和json用法一样

可以直接写入读取多行

dict1 = {'name':'yuan','age':18}
dict2 = {'name':'alex','age':20}
dict3 = {'name':'jin','age':25}
f = open('log3','wb')
pickle.dump(dict1,f)
pickle.dump(dict2,f)
pickle.dump(dict3,f)
f.close()

f = open('log3','rb')
while True:
    try:
        print(pickle.load(f))
    except EOFError:
        break

序列化自定义类对象

class A:
    def  __init__(self,name,age):
        self.name = name
        self.age = age
a = A('alex',80)
import pickle
ret = pickle.dumps(a)
print(ret)
obj = pickle.loads(ret)
print(obj.__dict__)

f = open('log4','wb')
pickle.dump(a,f)
f.close()
f = open('log4','rb')
obj = pickle.load(f)
print(obj.__dict__)

3.shelve模块 只支持python，针对文件操作

import shelve
f = shelve.open('log5')
f['key'] = {'int':10, 'float':9.5,'str':'Sample data'}
f.close()
f1 = shelve.open('log5')
existing = f1['key']
f1.close()
print(existing)

f2 = shelve.open('log5')
f2['key']['int'] = 50 #不能修改已有结构中的值
f2['key']['new'] = 'new'# 不能在已有的结构中添加新的项
f2['key'] = 'new' #但是可以覆盖原来的结构
existing = f2['key']
f2.close()
print(existing)

hashlib模块

特点：

1）提供摘要算法，将字符串转换成数字，不同的字符串转换的数字一定不同。

2）一段字符串直接进行摘要和分成几段进行摘要的结果是相同的。

3）摘要过程不可逆。

用途：文件的一致性校验（md5），密文验证的时候加密(md5和sha)。

1.md5通用算法

import hashlib
m = hashlib.md5()
m.update('123456'.encode('utf-8'))
print(m.hexdigest()) # 打印十六进制

m = hashlib.md5('wahahah'.encode('utf-8')) #加盐
m.update('123456'.encode('utf-8'))
print(m.hexdigest())

username = 'yuan' #动态加盐
m = hashlib.md5(username.encode('utf-8'))
m.update('123456'.encode('utf-8'))
print(m.hexdigest()) #d3f17b4a0cf89aaa4ad56828e6bf9523

2.sha算法

用法和md5一样，安全系数更高，后面的数字越大安全系数越高，结果越长计算时间越长

m = hashlib.sha1()
m.update('123456'.encode('utf-8'))
print(m.hexdigest())

文件一致性校验

import hashlib #引用hashlib模块
def check(filename): #创建一个函数
    md5obj = hashlib.md5() #创建一个md5算法对象
    with open(filename,'rb') as f: #以读的形式打开文件得到一个文件句柄
        while True:
            content = f.read(1024) #读出文件内容，可以分成几段摘要
            if content:
                md5obj.update(content) #
            else:
                break
    return md5obj.hexdigest() #返回十六进制的字符串
ret1 = check('file1')
ret2 = check('file2')
print(ret1)
print(ret2)

configparse模块配置文件模块

logging模块记录日志模块

collections模块增加扩展数据类型

time时间模块

random模块

生成随机验证码

import random
def id_code(num):
    ret = ''
    for i in range(num):
        number = str(random.randint(0,9))
        alph_num1 = random.randint(65,90)
        alph_num2 = random.randint(97,122)
        alph1 = chr(alph_num1)
        alph2 = chr(alph_num2)
        choice = random.choice([number,alph1,alph2])
        ret += choice
    return ret

print(id_code(6))

sys 模块

1.sys.argv：以脚本的形式执行一个文件的时候可以加一些参数，主要用于执行脚本前的登录和指定脚本的启动模式

两个用法：

1）执行脚本前的登录

import sys
print(sys.argv) #返回一个列表，列表第一项是当前文件所在的路径
if sys.argv[1] == 'alex' and sys.argv[2] == '1234': #设置两个参数
    print('登录成功')
else:
    sys.exit()

在以脚本的形式执行时直接输入两个参数就可以了

2）制定脚本的启动模式

import sys #引用sys模块
import logging #引用记录日志模块
inp = sys.argv[1] if len(sys.argv) > 1 else 'WARNING' #如果sys.argv的长度大于1，inp等于sys.argv的第一项，否则inp等于warning
logging.basicConfig(level=getattr(logging,inp)) #登录日志级别设置为inp
num = int(input('>>>')) #输入数字
logging.debug(num) #设置打印级别为debug
a = num * 100
logging.debug(a)
b = a - 10
logging.debug(b)
c = b + 5
print(c)

2.sys.path 导入模块的时候从这个路径获取。

3.sys.exit() 退出程序。

4.sys.version 查看当前python解释器版本。

5.sys.platform 查看当前操作系统。

os模块

os模块是与操作系统交互的一个接口

'''
os.getcwd() 获取当前工作目录，即当前python脚本工作的目录路径
os.chdir("dirname")  改变当前脚本工作目录；相当于shell下cd
os.curdir  返回当前目录: ('.')
os.pardir  获取当前目录的父目录字符串名：('..')
os.makedirs('dirname1/dirname2')    可生成多层递归目录
os.removedirs('dirname1')    若目录为空，则删除，并递归到上一级目录，如若也为空，则删除，依此类推
os.mkdir('dirname')    生成单级目录；相当于shell中mkdir dirname
os.rmdir('dirname')    删除单级空目录，若目录不为空则无法删除，报错；相当于shell中rmdir dirname
os.listdir('dirname')    列出指定目录下的所有文件和子目录，包括隐藏文件，并以列表方式打印
os.remove()  删除一个文件
os.rename("oldname","newname")  重命名文件/目录
os.stat('path/filename')  获取文件/目录信息
os.sep    输出操作系统特定的路径分隔符，win下为"\",Linux下为"/"
os.linesep    输出当前平台使用的行终止符，win下为"	
",Linux下为"
"
os.pathsep    输出用于分割文件路径的字符串 win下为;,Linux下为:
os.name    输出字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.system("bash command")  运行shell命令，直接显示
os.popen("bash command).read()  运行shell命令，获取执行结果
os.environ  获取系统环境变量


os.path
os.path.abspath(path) 返回path规范化的绝对路径 os.path.split(path) 将path分割成目录和文件名二元组返回 os.path.dirname(path) 返回path的目录。其实就是os.path.split(path)的第一个元素 os.path.basename(path) 返回path最后的文件名。如何path以／或结尾，那么就会返回空值。
                        即os.path.split(path)的第二个元素
os.path.exists(path)  如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)  如果path是绝对路径，返回True
os.path.isfile(path)  如果path是一个存在的文件，返回True。否则返回False
os.path.isdir(path)  如果path是一个存在的目录，则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  将多个路径组合后返回，第一个绝对路径之前的参数将被忽略
os.path.getatime(path)  返回path所指向的文件或者目录的最后访问时间
os.path.getmtime(path)  返回path所指向的文件或者目录的最后修改时间
os.path.getsize(path) 返回path的大小
'''

re模块

正则表达式

概念：正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。

主要用于：表单验证—使用一些规则来检测字符串是否符合要求。

爬虫—从一段字符串中找到符合要求的内容。

字符组：在同一个位置可能出现的各种字符组成了一个字符组，用[ ]表示，一个字符组只能匹配一个字符。

字符

量词