python学习之路（十一）

这一节主要讲一下【json and pickle】

先说一个例子

假如打游戏你花好长时间养了一个小怪兽然后你中午去吃饭

你没法砍别人了怕别人给你的小怪兽砍死但是你又不想退出

因为你得养着那个小怪兽那怎么办？ —— 挂机

就是你先给它挂起就是当前这个环境然后多少滴血

多少有多少宝贝神马神马滴。。。 kua cha 就挂起了

就跟暂停了差不多然后吃饭回来再给它恢复

恢复之后又开始相互砍就运行起来了

那还有可以举虚拟机的例子

虚拟机它就可以暂停挂起然后它也可以恢复

之前哪个页面哪个终端哪个路径神马神马滴。。。

这个是怎么实现的呢？

它肯定是中断的时候保存了一个什么东西

它保存在哪里？ —— 全都保存在文件里面对文件

因为虚拟机运行是在内存运行的保存文件的时候

是从内存里面把状态数据拷贝一个镜像放到磁盘上面

内存里面的东西它不仅仅是字符串它可以有其它的数据类型

比如字典列表函数类这些东西

但是保存在文件里文件它只能保存字符串或者说是二进制码

f = open('file.txt', 'w')

info = {
    'name':'lucia',
    'age':18
}

f.write(info)

f.close()

这段代码它先 open 一个文件 f

然后有一个字典 info

把字典写入文件 —— 报错：

第二阶段 15 json and pickle 序列化 - Lucia - Lucias WorkShop

报错意思是 write 到文件必须是 str 不能是 dict

那这个好办 —— 强制转换成字符串：

f.write(str(info))

然后代码不报错了而且也存进去了：

就是说文件它只能保存字符串不能存字典神马神马滴

存进去之后还要恢复才行

现在把一个内存里面的字典的数据类型变成字符串

然后存到了磁盘上 —— 这个过程叫做序列化

有序列化就肯定有反序列化 —— 就是在加载回内存里面

在一个新的程序里面打开刚才那个文件

f = open('file.txt', 'r')

然后读进来

data = f.read()
print(data)

读进来还不是最终目的因为它是以字符串形式读进来的没办法操作

还记得那个 eval 吧

data = eval(f.read())

这样子确实是可以解决问题的

那还有没有其它办法呢？

因为除了 eval 之外还有更通用更标准更规范的办法

—— 就是反序列化 json

它序列化的时候要写到文件但并不是像 str 那样强制转换的

f.write(json.dumps(info))

这样子的

然后反序列化的时候再 import json

data = json.loads(f.read())

这样子就反序列化到内存里面去了

所以序列化是 dumps 反序列化是 loads

内存 --- 磁盘 --- 内存

运行 --- 挂起 --- 运行

就这个过程很简单容易理解

毕竟现在从内存挂起和从磁盘恢复的只是一个字典

如果是函数又会怎样

import json

def sayhi(name):
    print('hello, ', name)

info = {
    'name':'lucia',
    'job':'it',
    'func':sayhi
}

f = open('lucia_de_file', 'w')

f.write(json.dumps(info))

f.close()

这样子会触发报错：

TypeError: Object of type 'function' is not JSON serializable

意思是：函数类型不是可序列化的类型

所以 json 它只能处理简单的数据类型字典啊列表啊字符串啊这些简单的

原因是 json 是在各种语言之间通用的它负责各种语言之间的数据交互

就比方说 python 程序要和 java 程序交互和 PHP 程序交互等等

交互的时候把 Python 的字典转成 Java 的字典

把 Java 的列表转成 Python 的列表

所以不可以太复杂只能是简单的

再说一句 xml 它正在逐渐被 json 取代

因为 xml 它主要的作用也是在语言之间完成数据交互

但是 json 的好处在于它看上去很容易看懂很清晰

并且不需要额外的标签之类的东西来做很多的描述

最终 xml 必将被 json 完全取代

但是不管是 xml 还是 json 能处理的都是简单的类型

那如果就是要处理复杂的类型怎么办

那就不是 json 了换成 pickle 用法完完全全一样就行了

import pickle

f = open('lucia_de_file', 'wb')

f.write(pickle.dumps(info))

运行就没有毛病正常生成了 lucia_de_file

然后反序列化也是 pickle

import pickle

f = open('lucia_de_file', 'rb')

data = pickle.loads(f.read())

print(data)

这样子遭遇的报错是：

AttributeError: Can't get attribute 'sayhi' on <module '__main__' from '/Users/lucia_gaga/PycharmProjects/practice_lucia/222.py'>

这个原因是你需要把函数的内存地址反序列化到内存中去

但是刚才序列化的时候得到的内存地址没了

运行完了就没了所以根本就不应该这样写反序列化的代码

把 sayhi 函数的代码拷贝过来它的内存地址就不会丢了：

第二阶段 15 json and pickle 序列化（下） - Lucia - Lucias WorkShop

这样子就完成了反序列化

还有一种写法是

pickle.dump(info, f)

以及

pickle.load(f)

序列化一次 & 反序列化一次

f.write(json.dumps(info))

info['job'] = 'qa'
f.write(json.dumps(info))

两次序列化之间改一个值然后结果：

然后再看反序列化：

会报错

它的意思是只能 dump 一次然后 load 一次不能多次

还记得虚拟机快照吗

它其实是每个镜像保存为一个文件而不是一个文件里面放好多内容