Python标准库：pickle

pickle模块实现了用于序列化和反序列化Python对象结构的二进制协议。

序列化目的： 1、以某种存储形式使自定义对象持久化；

　　　　　　 2、将对象从一个地方传递到另一个地方；

　　　　　　 3、使程序更具维护性。

pickle.dump(obj,file[,protocol])

obj：序列化对象，上面的例子中是一个列表，它是基本类型，也可以序列化自己定义的类型。
file：一般情况下是要写入的文件。更广泛地可以理解为为拥有 write() 方法的对象，并且能接受字符串为为参数，所以，它还可以是一个 StringIO 对象，或者其它自定义满足条件的对象。
protocol：可选项。默认为 False（或者说 0），是以 ASCII 格式保存对象；如果设置为 1 或者 True，则以压缩的二进制格式保存对象。

import pickle

# 用 pickle.dump(integers, f) 将数据 integers 保存到了文件 20.dat 中
integer = [1, 2, 3, 4, 5]
f = open("20.dat", "wb")
pickle.dump(integer, f)

pickle.load()，读取文件，也称为反序列化

import pickle

# 用 pickle.dump(integers, f) 将数据 integers 保存到了文件 20.dat 中
integer = [1, 2, 3, 4, 5]
f = open("20.dat", "wb")
pickle.dump(integer, f)
f.close()

# 反序列化，读取文件
integer = pickle.load(open("20.dat", "rb"))
print(integer)

文件大小比较

import pickle
import os
import chardet

d = {}
integers = range(9999)
d["i"] = integers
print(d)

# 下面将这个 dict 格式的对象存入文件
f = open("21.dat", "wb")
pickle.dump(d, f)
f.close()

# 显示文件编码格式
ff = open("22.dat", "wb")
pickle.dump(d, ff, True)
ff.close()

ff = open("22.dat", "rb")
data = ff.read()
print(chardet.detect(data))

# 得到两个文件的大小
s1 = os.stat("21.dat").st_size
s2 = os.stat("22.dat").st_size

print("%d, %d, %.2f%%" % (s1, s2, s2/s1 * 100))

自定义类型

import pickle
from io import StringIO, BytesIO
# 跟 file 功能类似，只不过是在内存中操作“文件”


# 自定义一种类型
class Book(object):
    def __init__(self, name):
        self.name = name

    def my_book(self):
        print("my book is:", self.name)


book = Book("<from beginner to master>")
book.my_book()

file = BytesIO()
pickle.dump(book, file, True)
# 查看“文件”内容，注意下面不是乱码
print(file.getvalue())

# 换一种方式，再看内容，可以比较一下
# 视觉上，两者就有很大差异
pickle.dump(book, file)
print(file.getvalue())

# 如果要从文件中读出来：
# 找到对应类型
file.seek(0)
book2 = pickle.load(file)
book2.my_book()
file.close()

从现在开始，种下梦想中的参天大树