Python学习日记(十八) 序列化模块

什么是序列?

就是每一个元素被有序的排成一列

什么是序列化?

就是将原本的列表、字典等内容转化成字符串的过程

什么时候会用到序列化?

数据存储(把数据放在文件、数据库),网络传输等

序列化的目的

1.以某种存储形式使自定义对象持久化

2.将对象从一个地方传递到另一个地方

3.使程序更具维护性

序列化:数据结构转换成字符串

反序列化:字符串转换成数据结构

三大序列化模块:

1.Json

特点:

json是一个通用的序列化格式且只有很少一部分数据(str、list、dict、tuple、数字)类型能够通过json转化成字符串

json.dumps():

方法使用序列化,将一个数据类型转化成字符串类型

import json
dic = {'k1': 2,'k2': 3 }
str_d = json.dumps(dic)
print(type(str_d),str_d)    　　#<class 'str'> {"k1": 2, "k2": 3}

元祖的序列化:

在json这里元祖会被转成列表再去序列化

import json
tu = (1,'a',['y',2])
print(type(tu),tu)              #<class 'tuple'> (1, 'a', ['y', 2])
str_t = json.dumps(tu)
print(type(str_t),str_t)        #<class 'str'> [1, "a", ["y", 2]]

json.loads():

方法使用反序列化,将一个字符串类型还原成原数据类型

import json
str_d = '{"k1": 2, "k2": 3}'
dict = json.loads(str_d)
print(type(dict),dict)      #<class 'dict'> {'k1': 2, 'k2': 3}

这里字符串内部的键值要""表示,否则会报错

元祖的反序列化:

结果会转成一个列表,可以用list()方法再转成元祖

json.dump():

接收文件句柄和数据类型,再将该数据类型转换成json字符串写入文件中

import json
dic = {'k1' : 1,'k2' : 2,'k3' : 3}
with open('jsonTestfile','w',encoding='utf-8') as f:
    json.dump(dic,f)

程序执行前:

程序执行后:

json.load():

接收一个文件句柄,将文件中json字符串转成数据结构返回

import json
with open('jsonTestfile') as f:
    get_str = json.load(f)
print(get_str)      #{'k1': 1, 'k2': 2, 'k3': 3}

如果这个文件有汉字等非ASCII的字符,文件会被写成一个bytes类型

import json
dic = {'k1':'中国','k2':'美国','k3':123,'k4':'abc1'}
with open('jsonTestFile','w',encoding='utf-8') as f:
    json.dump(dic,f,ensure_ascii=False)     #关闭ensure_ascii这样汉字就不变成乱码了
with open('jsonTestFile',encoding='utf-8') as f:
    print(json.load(f))                     #{'k1': '中国', 'k2': '美国', 'k3': 123, 'k4': 'abc1'}

总结:

在这里从文件写入一个json支持的数据类型或从中取出一个json字符串,这里用到的方法dumpsloads都是从内存中直接取出想要的数据,dumpload则都是从文件中取出想要的数据

前面所归纳到的方法都只能一行一行去获取数据,如果我们要多行获取:

import json
l = [{'k1':'a','k2':'b','k3':1}]
#将每一个列表中的字典迭代获取并转成json字符串并以分行格式写入文件
with open('jsonTestFile','w') as f:
    for dic in l:
        str_dic = json.dumps(dic)
        f.write(str_dic+'
')
#打开这个文件将里面的字符串每行去换行再存入到收集器中,最后再打印结果
with open('jsonTestFile') as f:
    colletion = []
    for line in f:
        dic = json.loads(line.strip())
        colletion.append(dic)
print(colletion)        #[{'k1': 'a', 'k2': 'b', 'k3': 1}]

2.Pickle

特点:

pickle可以将所有的python中的数据类型转成字符串形式,pickle序列化的内容只有python才能够理解,且部分序列化依赖python代码

pickle.dumps()

将一个数据类型转换成二进制内容,这里dumps()的参数支持python内的所有数据类型

import pickle
dic = {'k1': 1,'k2': 2,'k3': 3}
set = {1,2,'s'}
tu = (1,2,'avb')
li = ['k',1,'s',666]

pstr_d = pickle.dumps(dic)
print(type(pstr_d),pstr_d)  #<class 'bytes'> b'x80x03}qx00(Xx02x00x00x00k1qx01Kx01Xx02x00x00x00k2qx02Kx02Xx02x00x00x00k3qx03Kx03u.'
pstr_s = pickle.dumps(set)
print(type(pstr_s),pstr_s)  #<class 'bytes'> b'x80x03cbuiltins
set
qx00]qx01(Kx01Kx02Xx01x00x00x00sqx02ex85qx03Rqx04.'
pstr_t = pickle.dumps(tu)
print(type(pstr_t),pstr_t)  #<class 'bytes'> b'x80x03Kx01Kx02Xx03x00x00x00avbqx00x87qx01.'
pstr_l = pickle.dumps(li)
print(type(pstr_l),pstr_l)  #<class 'bytes'> b'x80x03]qx00(Xx01x00x00x00kqx01Kx01Xx01x00x00x00sqx02Mx9ax02e.'

pickle.loads()

将读取到的这一个二进制文件转换为数据类型

import pickle
pstr_d = b'x80x03}qx00(Xx02x00x00x00k1qx01Kx01Xx02x00x00x00k2qx02Kx02Xx02x00x00x00k3qx03Kx03u.'
print(pickle.loads(pstr_d))     #{'k1': 1, 'k2': 2, 'k3': 3}
pstr_s = b'x80x03cbuiltins
set
qx00]qx01(Kx01Kx02Xx01x00x00x00sqx02ex85qx03Rqx04.'
print(pickle.loads(pstr_s))     #{1, 2, 's'}
pstr_t = b'x80x03Kx01Kx02Xx03x00x00x00avbqx00x87qx01.'
print(pickle.loads(pstr_t))     #(1, 2, 'avb')
pstr_l = b'x80x03]qx00(Xx01x00x00x00kqx01Kx01Xx01x00x00x00sqx02Mx9ax02e.'
print(pickle.loads(pstr_l))     #['k', 1, 's', 666]

pickle.dump()

import pickle,time
struct_time = time.gmtime(15000000)
print(struct_time)      #time.struct_time(tm_year=1970, tm_mon=6, tm_mday=23, tm_hour=14, tm_min=40, tm_sec=0, tm_wday=1, tm_yday=174, tm_isdst=0)
with open('pickleTestFile','wb') as f:
    pickle.dump(struct_time,f)

pickle.load()

import pickle,time
struct_time = time.gmtime(15000000)
with open('pickleTestFile','rb') as f:
    print(pickle.load(f))#time.struct_time(tm_year=1970, tm_mon=6, tm_mday=23, tm_hour=14, tm_min=40, tm_sec=0, tm_wday=1, tm_yday=174, tm_isdst=0)

3.Shelve

特点:

shelve可以序列化句柄,可以使用句柄直接操作非常方便

直接创建一个shelve对象

import shelve
f = shelve.open('shelveFile')
f['key'] = {'int': 10,'float': 15.6,'string' :'abc123'}
f.close()

固定生成三个shelve专属的文件

取出存入DB中的数据

import shelve
f = shelve.open('shelveFile')
getData = f['key']
f.close()
print(getData)      #{'int': 10, 'float': 15.6, 'string': 'abc123'}

由于shelve在默认情况下是不会记录待持久化对象的任何修改的,所以我们在shelve.open()时候需要修改参数,否则对象的修改不会保存

关于shelve的学习链接:https://www.cnblogs.com/sui776265233/p/9225164.html#_label2