4-20模块 序列化模块 hashlib模块

1,模块,py文件就是模块,py之所以好用就是模块多。

2,模块的分类:

  1,内置模块,python 安装时自带的模块

  2,扩展模块,别人写好的,需要安装之后,可以直接使用。itchat微信模块, beautiful soap ,selenium 网页自动化测试工具,django,tornado。

  3,自定义模块,自己写的模块。 

3,内置模块

  序列化模块,hashlib模块

将原本的字典、列表等内容转换成一个字符串的过程就叫做序列化

反序列化:把转换的数据恢复为对象的过程称为对象的反序列化。

为什么要有序列化呢?

因为能存储在文件中的一定是字符串或者字节,能在网络上传输的只有字节。

4,python 的序列化模块

json 模块:所有编程语言都通用的序列化格式,它支持的数据类型非常有限,数字,字符串,列表和字典。

pickle 模块:只能在python语言的程序之间传递数据用的,pickle 支持python中所有的数据类型。

shelve python3*之后才有的。

json模块

import json
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = json.dumps(dic)  #序列化:将一个字典转换成一个字符串
print(type(str_dic),str_dic)  #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
#注意,json转换完的字符串类型的字典中的字符串是由""表示的

dic2 = json.loads(str_dic)  #反序列化:将一个字符串格式的字典转换成一个字典
#注意,要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
print(type(dic2),dic2)  #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}


list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
str_dic = json.dumps(list_dic) #也可以处理嵌套的数据类型 
print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
list_dic2 = json.loads(str_dic)
print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]

loads和dumps
View Code

json.dumps(对象) 转化成字符串。

json.loads(对象)再转化成原来的数据类型。

dump 方法接受一个文件句柄,直接将对象转换成json字符串写入文件。

load 方法接受一个文件句柄,直接将对象中的json字符串转换成数据结构返回。从文件中提取。

import json
dict ={'dabiagr':('ad',23,'234')}
f = open('大表哥','w',encoding='utf-8')
json.dump(dict,f,ensure_ascii=False)在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示
f.close()
import json
dict ={'dabiagr':('ad',23,'234')}
ret = json.dumps(dict,ensure_ascii=False)
print(type(dict),dict)
print(type(ret),ret)

ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。)

json 的格式化输出

import json
data = {'username':['李华','二愣子'],'sex':'male','age':18}
json_dic = json.dumps(data,sort_keys=True,indent=4,separators=(',',':'),ensure_ascii=False)
print(json_dic)
separators 分隔符
indent 缩进可以自定义
sort_keys 排序关键字

pickle 模块

import pickle
dic = {(190,90,'捏脚'):"大表哥"}
ret = pickle.dumps(dic)   # 序列化结果 不是一个可读的字符串 而是一个bytes类型
print(ret)
print(pickle.loads(ret))

dic = {(190,90,'捏脚'):"大表哥"}
f = open('大表哥2','wb')  # 使用pickle dump必须以+b的形式打开文件
pickle.dump(dic,f)
f.close()

f = open('大表哥2','rb')#读取的时候也是以rb的形式读取
print(pickle.load(f))
f.close()
json 在写入多次dump的时候 不能对应执行多次load来取出数据,pickle可以
json 如果要写入多个元素 可以先将元素dumps序列化,f.write(序列化+' ')写入文件
读出元素的时候,应该先按行读文件,在使用loads将读出来的字符串转换成对应的数据类型
import pickle
# 关于写多行
dic1 = {"大表哥":(190,90,'捏脚')}
dic2 = {"2表哥":(190,90,'捏脚')}
dic3 = {"3表哥":(190,90,'捏脚')}
f = open('大表哥3','wb')
pickle.dump(dic1,f)
pickle.dump(dic2,f)
pickle.dump(dic3,f)
f.close()

读写入的多行
f = open('大表哥3','rb')
while True:
    try:
        print(pickle.load(f))
    except EOFError:
        break

shelve模块

shelve也是python提供给我们的序列化工具,比pickle用起来更简单一些。
shelve只提供给我们一个open方法,是用key来访问的,使用起来和字典类似。

专有的序列化模块,只针对文件。



原文地址:https://www.cnblogs.com/yzxing/p/8893390.html