19-json与pickle模块（序列化与反序列化）

一、json模块

1.1 什么是序列化&反序列化

内存中的数据类型---->序列化---->特定的格式（json格式或者pickle格式）
内存中的数据类型<----反序列化<----特定的格式（json格式或者pickle格式）

土办法：
{'aaa':111}--->序列化str({'aaa':111})----->"{'aaa':111}"
{'aaa':111}<---反序列化eval("{'aaa':111}")<-----"{'aaa':111}"

1.2 为何要序列化

序列化得到结果=>特定的格式的内容有两种用途
1、可用于存储=》用于存档
2、传输给其他平台使用=》跨平台数据交互
     python                 java
      列表     特定的格式      数组

强调：
    针对用途1的特定一格式：可是一种专用的格式=》pickle只有python可以识别
    针对用途2的特定一格式：应该是一种通用、能够被所有语言识别的格式=》json

1.3 如何序列化与反序列化

# 示范1
import json
# 序列化
json_res=json.dumps([1,'aaa',True,False])
print(json_res,type(json_res)) # "[1, "aaa", true, false]"
#
# 反序列化
l=json.loads(json_res)
print(l,type(l))

1、序列化写入文件

import json

# 序列化的结果写入文件的复杂方法
json_res=json.dumps([1,'aaa',True,False])
# print(json_res,type(json_res)) # "[1, "aaa", true, false]"
with open('test.json',mode='wt',encoding='utf-8') as f:
    f.write(json_res)

# 将序列化的结果写入文件的简单方法
with open('test.json',mode='wt',encoding='utf-8') as f:
    json.dump([1,'aaa',True,False],f)

2、反序列化读取文件

# 从文件读取json格式的字符串进行反序列化操作的复杂方法
with open('test.json',mode='rt',encoding='utf-8') as f:
    json_res=f.read()
    l=json.loads(json_res)
    print(l,type(l))

# 从文件读取json格式的字符串进行反序列化操作的简单方法
with open('test.json',mode='rt',encoding='utf-8') as f:
    l=json.load(f)
    print(l,type(l))

1.4 json格式

1、json格式不可与python混淆，str为双引号。

2、json中只有以上格式，不能识别某一语言所独有的类型。

import json
# json验证: json格式兼容的是所有语言通用的数据类型，不能识别某一语言的所独有的类型
# json.dumps({1,2,3,4,5})                           # error: Object of type set is not JSON serializable

# json强调：一定要搞清楚json格式，不要与python混淆
l=json.loads('[1, "aaa", true, false]')             # corroct
l=json.loads("[1,1.3,true,'aaa', true, false]")     # error:json.decoder.JSONDecodeError: Expecting value: line 1 column 13 (char 12)
print(l[0])

3、json在python3.5以后，可以识别bytes类型，但只可读，不可写。（wb模式下，不可直接使用 json.dump(user_dict,f)，其内部会将user_dict转换成str再写入，而此时系统分配的文件权限是b模式）

4、在json中出现中文，会以Unicode的二进制编码以字符串类型存入

l = json.loads(b'[1, "aaa", true, false]')
print(l, type(l))
#
with open('test.json',mode='rb') as f:
    l=json.load(f)


res=json.dumps({'name':'哈哈哈'})
print(res,type(res))            # {"name": "u54c8u54c8u54c8"} <class 'str'>

res=json.loads('{"name": "u54c8u54c8u54c8"}')
print(res,type(res))            # {'name': '哈哈哈'} <class 'dict'>

1.5 猴子补丁

在入口处打猴子补丁，不用改原代码，也无须在子文件中处处改为 import ujson as json

# 在入口处打猴子补丁
import json
import ujson

def monkey_patch_json():
    json.__name__ = 'ujson'
    json.dumps = ujson.dumps
    json.loads = ujson.loads

monkey_patch_json()     # 在入口文件出运行

二、pickle 模块

内存中的数据类型---->序列化---->特定的格式（json格式或者pickle格式）
内存中的数据类型<----反序列化<----特定的格式（json格式或者pickle格式）
pickle为python可识别的，且无类型限制。

import pickle
 
dic={'name':'alvin','age':23,'sex':'male'}
 
print(type(dic))#<class 'dict'>
 
j=pickle.dumps(dic)
print(type(j))#<class 'bytes'>
 
 
f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'
f.write(j)  #-------------------等价于pickle.dump(dic,f)
 
f.close()
#-------------------------反序列化
import pickle
f=open('序列化对象_pickle','rb')
 
data=pickle.loads(f.read())#  等价于data=pickle.load(f)
 
 
print(data['age'])

python2 python3 兼容性问题

# coding:utf-8
import pickle

with open('a.pkl',mode='wb') as f:
    # 一：在python3中执行的序列化操作如何兼容python2
    # python2不支持protocol>2，默认python3中protocol=4
    # 所以在python3中dump操作应该指定protocol=2
    pickle.dump('你好啊',f,protocol=2)

with open('a.pkl', mode='rb') as f:
    # 二：python2中反序列化才能正常使用
    res=pickle.load(f)
    print(res)

python2与python3的pickle兼容性问题

三、XML

现在已逐渐被淘汰，详细可参照这篇博客：https://www.cnblogs.com/linhaifeng/articles/6384466.html#_label8