序列化模块

序列化：从数据类型---->字符串的过程

反序列化：从字符串----->数据类型的过程

使用场景：

1.数据存储和提取

2.网络传输的时候

序列化模块：

1.json 重要指数：五星

特点：

①通用的序列化格式

②只有很少的一部分数据类型能够通过jason转化成字符串

2.pickle 重要指数：四星

特点：

①所有的python中的数据类型都可以转化成字符串形式

②pickle序列化的内容只有python能理解

③部分反序列化依赖python代码

3.shelve 重要指数：三星

特点：

①序列化句柄

②使用句柄直接操作，非常方便

方法：

json 适用的数据类型：数字、字符串、列表、字典、元组（元组是转换成列表进行序列化）

dumps 序列化方法 loads 反序列化方法

这是在内存中将数据进行序列化和反序列化操作，数据还在内存中。

import json
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = json.dumps(dic)  #序列化：将一个字典转换成一个字符串
print(type(str_dic),str_dic)  #<class 'str'> {"k3": "v3", "k1": "v1", "k2": "v2"}
#注意，json转换完的字符串类型的字典中的字符串是由""表示的

dic2 = json.loads(str_dic)  #反序列化：将一个字符串格式的字典转换成一个字典
#注意，要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
print(type(dic2),dic2)  #<class 'dict'> {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}


list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
str_dic = json.dumps(list_dic) #也可以处理嵌套的数据类型 
print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
list_dic2 = json.loads(str_dic)
print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}]

loads和dumps

dump 和 load 对文件进行操纵，直接把数据类型序列化后存储，和反序列化的提取数据类型

import json
f = open('json_file','w')
dic = {'k1':'v1','k2':'v2','k3':'v3'}
json.dump(dic,f)  #dump方法接收一个文件句柄，直接将字典转换成json字符串写入文件
f.close()

f = open('json_file')
dic2 = json.load(f)  #load方法接收一个文件句柄，直接将文件中的json字符串转换成数据结构返回
f.close()
print(type(dic2),dic2)

load和dump

编码中文的问题，在dumps和dump ensure_ascii 加上就能在文件中显示中文，否则是bytes类型显示在文件中，但是并不影响存储和提取

import json
f = open('file','w')
json.dump({'国籍':'中国'},f)
ret = json.dumps({'国籍':'中国'})
f.write(ret+'
')
json.dump({'国籍':'美国'},f,ensure_ascii=False)
ret = json.dumps({'国籍':'美国'},ensure_ascii=False)
f.write(ret+'
')
f.close()

ensure_ascii关键字参数

dump和load在文件中的操作只能是一次性的，多次写就不能load，报错，利用dumps和loads解决多行存取的问题

import json
l = [{'k': '111'},{'k2': '111'}, {'k3': '111'}]
f = open('file', 'w')

for dic in l:
    str_dic = json.dumps(dic)
    f.write(str_dic+'
')
f.close()

f = open('file')

l = []
for line in f:
    dic = json.loads(line.strip())
    l.append(dic)
f.close()
print(l)

pickle

pickle模块提供了四个功能：dumps、dump(序列化，存）、loads（反序列化，读）、load （不仅可以序列化字典，列表...可以把python中任意的数据类型序列化）

dumps和loads是针对内存当中的数据类型进行序列化

dump和load是针对文件当中的存取

dumps 和 loads
>>> import pickle
>>> dic = {'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
>>> pickle.dumps(dic)  # bytes类型
b'x80x03}qx00(Xx02x00x00x00k1qx01Xx02x00x00x00v1qx02Xx02x00x00x00k2qx03Xx02x00x00x00v2qx04Xx02x00x00x00k3qx05Xx02x00.'

>>> dic1 = pickle.dumps(dic)
>>> pickle.loads(dic1)  # 转成字典类型
{'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}

dump 和 load
import pickle
dic = {'k1': '中国', 'k2': 'v2', 'k3': 'v3'}


f = open('fff', 'wb')  # 写的时候需要用b模式
pickle.dump(dic, f)   # 多次写
pickle.dump(dic, f)
f.close()

f = open('fff', 'rb')  # load的时候需要用b模式  同时可以多次写，同等次数的读，次数不同会漏
data = pickle.load(f)
data1 = pickle.load(f)
f.close()
print(data, data1)

json & pickle

相同的地方：都有dumps、loads、dump、load四个方法

不同的地方：

json：跨语言，通用型，只支持数字、字符串、列表、元组、字典数据类型的序列化操作，体积小

pickle：支持python所有数据类型的序列化操作，占内存，dump和load的时候必须是在b的模式下。

使用：如果你序列化的内容是列表或者字典，我们非常推荐你使用json模块；但如果出于某种原因你不得不序列化其他的数据类型，而未来你还会用python对这个数据进行反序列化的话，那么就可以使用pickle

shelve

shelve模块是一个简单的k,v将内存数据通过文件持久化的模块，可以持久化任何pickle可支持的python数据格式

shelve只提供给我们一个open方法，是用key来访问的，使用起来和字典类似。

shelve.open(filename, flag='c', protocol=None, writeback=False) # 4个参数

import shelve

f = shelve.open('shelve_test')  # 打开一个文件

names = ["alex", "rain", "test"]
info = {'name':'alex','age':22}

f["names"] = names  # 持久化列表
f['info_dic'] = info

f.close()

import shelve
f1 = shelve.open('shelve_file')
existing = f1['names']  #取出数据的时候也只需要直接用key获取即可，但是如果key不存在会报错
f1.close()
print(existing)

这个模块有个限制，它不支持多个应用同一时间往同一个DB进行写操作。所以当我们知道我们的应用如果只进行读操作，我们可以让shelve通过只读方式打开DB

import shelve
f = shelve.open('shelve_file', flag='r')
existing = f['key']
f.close()
print(existing)

由于shelve在默认情况下是不会记录待持久化对象的任何修改的，所以我们在shelve.open()时候需要修改默认参数，否则对象的修改不会保存。

import shelve
f1 = shelve.open('shelve_file')  # 此时修改不能保存
print(f1['key'])
f1['key']['new_value'] = 'this was not here before'
f1.close()

f2 = shelve.open('shelve_file', writeback=True)  # 修改保存
print(f2['key'])
f2['key']['new_value'] = 'this was not here before'
f2.close()

writeback方式有优点也有缺点。优点是减少了我们出错的概率，并且让对象的持久化对用户更加的透明了；但这种方式并不是所有的情况下都需要，首先，使用writeback以后，shelf在open()的时候会增加额外的内存消耗，并且当DB在close()的时候会将缓存中的每一个对象都写入到DB，这也会带来额外的等待时间。因为shelve没有办法知道缓存中哪些对象修改了，哪些对象没有修改，因此所有的对象都会被写入。