Python学习笔记12：标准库之对象序列化（pickle包，cPickle包）

计算机的内存中存储的是二进制的序列。
我们能够直接将某个对象所相应位置的数据抓取下来，转换成文本流 (这个过程叫做serialize)，然后将文本流存入到文件里。
因为Python在创建对象时，要參考对象的类定义，所以当我们从文本中读取对象时，必须在手边要有该对象的类定义，才干懂得怎样去重建这一对象。
从文件读取时，对于Python的内建(built-in)对象 (比方说整数、词典、表等等)，因为其类定义已经加载内存，所以不须要我们再在程序中定义类。
但对于用户自行定义的对象，就必需要先定义类，然后才干从文件里加载对象。

一 pickle包

对于上述过程，最经常使用的工具是Python中的pickle包。

1 将内存中的对象转换成为文本流：

import pickle

class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
summer = Bird()
pickleString = pickle.dumps(summer) # serialize object

使用pickle.dumps()方法能够将对象summer转换成了字符串 picklestring(也就是文本流)。
随后我们能够用普通文本的存储方法来将该字符串储存在文件(文本文件的输入输出)。

import pickle

class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
summer = Bird()
fileName = 'save.pkl'
with open(fileName, 'w') as f: # open file with write-mode
    pickleString = pickle.dump(summer, f) # serialize and save object

对象summer存储在文件save.pkl

2 重建对象

首先，我们要从文本中读出文本，存储到字符串 (文本文件的输入输出)。
然后使用pickle.loads(str)的方法，将字符串转换成为对象。
要记得，此时我们的程序中必须已经有了该对象的类定义。

import pickle
 
# define the class before unpickle
class Bird(object):
    have_feather = True
    way_of_reproduction  = 'egg'
 
fileName = 'save.pkl'
with open(fileName, 'r') as f:
    summer = pickle.load(f) # read file and build object

二 cPickle包

cPickle包的功能和使用方法与pickle包差点儿全然同样，其存在区别的地方实际上非常少用到；
不同在于cPickle是基于c语言编写的，速度是pickle包的1000倍。
对于上面的样例，假设想使用cPickle包，我们都能够将import语句改为:

import cPickle as pickle

就不须要再做不论什么修改了。