4-20模块序列化模块 hashlib模块

1，模块，py文件就是模块，py之所以好用就是模块多。

2，模块的分类：

　　1，内置模块，python 安装时自带的模块

　　2，扩展模块，别人写好的，需要安装之后，可以直接使用。itchat微信模块, beautiful soap ,selenium 网页自动化测试工具，django,tornado。

　　3，自定义模块，自己写的模块。

3，内置模块

　　序列化模块，hashlib模块

将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化

反序列化：把转换的数据恢复为对象的过程称为对象的反序列化。

为什么要有序列化呢？

因为能存储在文件中的一定是字符串或者字节，能在网络上传输的只有字节。

4，python 的序列化模块

json 模块：所有编程语言都通用的序列化格式，它支持的数据类型非常有限，数字，字符串，列表和字典。

pickle 模块：只能在python语言的程序之间传递数据用的，pickle 支持python中所有的数据类型。

shelve python3*之后才有的。

json模块

import json
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = json.dumps(dic)  #序列化：将一个字典转换成一个字符串
print(type(str_dic),str_dic)  #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
#注意，json转换完的字符串类型的字典中的字符串是由""表示的

dic2 = json.loads(str_dic)  #反序列化：将一个字符串格式的字典转换成一个字典
#注意，要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
print(type(dic2),dic2)  #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}


list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
str_dic = json.dumps(list_dic) #也可以处理嵌套的数据类型 
print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
list_dic2 = json.loads(str_dic)
print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]

loads和dumps

View Code

json.dumps(对象) 转化成字符串。

json.loads(对象)再转化成原来的数据类型。

dump 方法接受一个文件句柄，直接将对象转换成json字符串写入文件。

load 方法接受一个文件句柄，直接将对象中的json字符串转换成数据结构返回。从文件中提取。

import json
dict ={'dabiagr':('ad',23,'234')}
f = open('大表哥','w',encoding='utf-8')
json.dump(dict,f,ensure_ascii=False)在dump时将ensure_ascii设置为False即可，此时存入json的中文即可正常显示
f.close()
import json
dict ={'dabiagr':('ad',23,'234')}
ret = json.dumps(dict,ensure_ascii=False)
print(type(dict),dict)
print(type(ret),ret)

ensure_ascii:，当它为True的时候，所有非ASCII码字符显示为uXXXX序列，只需在dump时将ensure_ascii设置为False即可，此时存入json的中文即可正常显示。)

json 的格式化输出

import json
data = {'username':['李华','二愣子'],'sex':'male','age':18}
json_dic = json.dumps(data,sort_keys=True,indent=4,separators=(',',':'),ensure_ascii=False)
print(json_dic)
separators 分隔符
indent 缩进可以自定义
sort_keys 排序关键字

pickle 模块

import pickle
dic = {(190,90,'捏脚'):"大表哥"}
ret = pickle.dumps(dic)   # 序列化结果 不是一个可读的字符串 而是一个bytes类型
print(ret)
print(pickle.loads(ret))

dic = {(190,90,'捏脚'):"大表哥"}
f = open('大表哥2','wb')  # 使用pickle dump必须以+b的形式打开文件
pickle.dump(dic,f)
f.close()

f = open('大表哥2','rb')#读取的时候也是以rb的形式读取
print(pickle.load(f))
f.close()

json 在写入多次dump的时候 不能对应执行多次load来取出数据，pickle可以
json 如果要写入多个元素 可以先将元素dumps序列化，f.write(序列化+'
')写入文件
           读出元素的时候，应该先按行读文件，在使用loads将读出来的字符串转换成对应的数据类型

import pickle
# 关于写多行
dic1 = {"大表哥":(190,90,'捏脚')}
dic2 = {"2表哥":(190,90,'捏脚')}
dic3 = {"3表哥":(190,90,'捏脚')}
f = open('大表哥3','wb')
pickle.dump(dic1,f)
pickle.dump(dic2,f)
pickle.dump(dic3,f)
f.close()

读写入的多行
f = open('大表哥3','rb')
while True:
    try:
        print(pickle.load(f))
    except EOFError:
        break

shelve模块

shelve也是python提供给我们的序列化工具，比pickle用起来更简单一些。
shelve只提供给我们一个open方法，是用key来访问的，使用起来和字典类似。

专有的序列化模块，只针对文件。

4-20模块 序列化模块 hashlib模块

4-20模块序列化模块 hashlib模块