Python学习之json序列化

一、什么是序列化

在我们存储数据或者网络传输数据的时候，需要对我们的对象进行处理，把对象处理成方便存储和传输的数据格式。这个过程叫序列化，不同的序列化结果也不同，但目的是一样的，都是为了存储和传输
在Python中三种序列化的方案：

pickle，可以将我们Python中任意数据类型转化为bytes并写入到文件中。同样也可以把文件中写好的bytes转换回到我们Python的数据-这个过程被称为反序列化。
shelve简单另类的一种序列化方案。有点类似于Redis，可以作为一种小型的数据库来使用。
json，将Python中常见的字典，列表转化成字符串，是目前前后端数据交互使用频率最高的一种数据模式。

二、json

1.什么是json

json是前后端交互的枢纽，相当于编程界的普通话，前后端用Python沟通。因为json的语法格式可以完美的表示出一个对象。那么什么是json：json全称JavaScript object notation，即js对象简谱，例如下面代码示例：

{
  "id": 1,
  "title": "Python从入门到放弃(第二版)",
  "pub_date": "2018-01-11",
  "category": "Python",
  "publisher": {
    "id": 1,
    "name": "北京出版社"
  },
  "post_authors": [
    {
      "id": 2,
      "name": "佚名"
    }
  ]
}

这段形如Python字典的东西在JavaScript里面叫json，其实是一样的。我们发现用这样的数据结构可以完美的表示出任何对象，并且可以完整的把对象表示出来。只要代码格式比较好，那么可读性也挺强的，所以大家公认用这样一种数据结构作为数据交互的格式。
在json之前，通常用的数据结构为XML，形如:

<?xml version="1.0" encoding="utf-8" ?>
<book>
<title>Python从入门到放弃(第二版)</title> 
<pub_date>2018-01-11</pub_date> 
<category>Python</category> 
<publisher>
    <id>1</id> 
    <name>北京出版社</name> 
</publisher>
</book>

总之，XML格式的文件在维护和处理上相比json文件很难解析，所以后来大都倾向于使用json这一数据结构了。

2.json在Python中的用法

字典 -> json

要先引入json模块，再进行处理

import json
dic = {"姓名": "程序猿", "年龄": 28, "头发": None}
s = json.dumps(dic)
print(s)

# 输出：
>>>{"u59d3u540d": "u7a0bu5e8fu733f", "u5e74u9f84": 28, "u5934u53d1": null}

结果很不友好啊. 那如何处理成中⽂呢? 在dumps的时候给出另一个参数ensure_ascii=False就可以了了。

import json
dic = {"姓名": "程序猿", "年龄": 28, "头发": None}
s = json.dumps(dic, ensure_ascii=False)
print(s)

# 输出：
>>>{"姓名": "程序猿", "年龄": 28, "头发": null}

json -> 字典

上面介绍的是如何把字典格式的数据转化为json，那么怎么把前端传递过来的json文件转化为字典格式呢：

import json
s = '{"姓名": "程序猿", "年龄": 28, "头发": null}'  
# 注意此处要加引号，表示s为字符串-the JSON object must be str
dic = json.loads(s)
print(dic)
print(type(dic))

# 输出：
>>> {'姓名': '程序猿', '年龄': 28, '头发': None} 
>>> <class 'dict'>

写入/读取json文件

json也可以像pickle一样把序列化的结果写入到文件中：

import json
dic = {"姓名": "程序猿", "年龄": 28, "头发": None}
f = open('test.json', mode='w', encoding="utf-8")
# 把对象打散成json写入到文件中
json.dump(dic, f, ensure_ascii=False)
f.close()

test.json中显示：

{
  "姓名": "程序猿",
  "年龄": 28,
  "头发": null
}

同样也可以从文件中读取一个json：

import json
f = open('test.json', mode='r', encoding="utf-8")
dic = json.load(f)
f.close()
print(dic)
# 输出：
>>> {'姓名': '程序猿', '年龄': 28, '头发': None}

注意: 我们可以向同一个文件中写入多个json串，但是读不行

import json
lst = [
    {"a": 1},
    {'b': 2},
    {'c': 3}
]
f = open("test.json", mode="w", encoding="utf-8")
for dic in lst:
    json.dump(dic, f)
f.close()

test.json中显示：

可以看到此时文件中的内容是一行的，所以会有红色下划线显示报错信息，这在读取的时候是无法正常读取的。如何解决读取问题呢？两种方案。
方案一：
把所有的内容准备好统一进行写入和读取，但是这样处理，如果数据量小还好，数据量大的话就很麻烦了。
方案二：
不用dump方法，改用dumps和loads，对每一行分别进行处理。

import json

lst = [
    {"a": 1},
    {'b': 2},
    {'c': 3}
]

# 写入
f = open("test.json", mode="w", encoding="utf-8")
for dic in lst:
    s = json.dumps(dic, ensure_ascii=True) + '
'
    f.write(s)
f.close()

# 读取
f = open("test.json", mode='r', encoding='utf-8')
for line in f:
    d = json.loads(line.strip())
    print(d)
f.close()

打印结果为：

{'a': 1}
{'b': 2}
{'c': 3}

这样的话就能正常读取了！