json&pickle模块

json&pickle模块

之前我们学习过用eval内置方法可以将一个字符串转成python对象，不过，eval方法是有局限性的，对于普通的数据类型，json.loads和eval都能用，但遇到特殊类型的时候，eval就不管用了,所以eval的重点还是通常用来执行一个字符串表达式，并返回表达式的值。

import json
x = "[null,true,false,1]"
#print(eval(x))   #报错，无法解析null类型，而json就可以
print(json.loads(x))

什么是序列化？

我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。

为什么要序列化？

1：持久保存状态

需知一个软件/程序的执行就在处理一系列状态的变化，在编程语言中，'状态'会以各种各样有结构的数据类型(也可简单的理解为变量)的形式被保存在内存中。

内存是无法永久保存数据的，当程序运行了一段时间，我们断电或者重启程序，内存中关于这个程序的之前一段时间的数据（有结构）都被清空了。

在断电或重启程序之前将程序当前内存中所有的数据都保存下来（保存到文件中），以便于下次程序执行能够从文件中载入之前的数据，然后继续执行，这就是序列化。

具体的来说，你玩使命召唤闯到了第13关，你保存游戏状态，关机走人，下次再玩，还能从上次的位置开始继续闯关。或如，虚拟机状态的挂起等。

2：跨平台数据交互

序列化之后，不仅可以把序列化后的内容写入磁盘，还可以通过网络传输到别的机器上，如果收发的双方约定好实用一种序列化的格式，那么便打破了平台/语言差异化带来的限制，实现了跨平台数据交互。

反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。

如何序列化之json和pickle：

import json
dic = {'name': 'lebron'}
print(type(dic))    #<class 'dict'>

data = json.dumps(dic)
print(data)    #{"name": "lebron"}
print(type(data))    #<class 'str'>

with open('序列化对象', 'w') as f:
    f.write(data)
#等价于json.dump(dic,f)


#-----------反序列化-------------

with open('序列化对象', 'r') as f :
    data = json.loads(f.read())
#等价于data=json.load(f)

注意点

import json
dct="{'1':111}"
#print(json.loads(dct))#报错,因为字典{'1':111}有单引号，json 不认单引号

dct='{"1":"111"}'
print(json.loads(dct))    #{'1': '111'}


--------------------------------conclusion-------------------------------------
无论数据是怎样创建的，只要满足json格式，就可以json.loads出来,不一定非要dumps的数据才能loads

pickle

import pickle

dic = {'name': 'lebron', 'age': 34, 'sex': 'male'}
data = pickle.dumps(dic)

with open('序列化对象_pickle', 'wb') as f:
     f.write(data)
#等价于pickle.dump(dic, f)

#-------------反序列化--------------
with open('pickle模块', 'rb') as f:
     data = pickle.loads(f.read())
#等价于data = pickle.load(f)

print(data['name'])    #lebron

Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系。