python序列化操作

对象的序列化在很多高级编程语言中都有相应的实现

程序运行时候所有的变量都是在内存中的

d=dict(url="index.html",title="首页",content="首页")

程序运行过程中爬取的页面的链接会不断变化

比如url改成second.html 但是程序一结束或意外中断程序中的内存变量会被操作系统进行回收。

如果没有把修改过的url存储起来下次运行的时候 url 被初始化为index.html

-----

把内存中的变量变成可存储或可传输的过程就是序列化

------

将内存中的变量序列化之后可以把序列化后的内容写入磁盘或者通过网络传输到别的机器上实现程序状态的保存和共享。

反过来把变量内容从序列化的对象重新读取到内存称为反序列化

------

Python cPickle pickle实现序列化

前者是c写的效率比后者高很多但是功能是一样的

先导入cPickle模块如果不存在再导入 pickle 模块

--------

try:
    import cPickle  as pickle
except ImportError:
    import pickle

------、--------------

pickle实现序列化主要使用的是 dumps方法或dump方法

dumps方法可以将任意对象序列化为一个str 然后将这个str写入文件进行保存

--------

dump 转储

-------

不同的编程语言之间传递对象把对象序列化为标准格式是关键例如XML

但是现在更加流行的是序列化为JSON格式

既可以被所有的编程语言读取解析

也可以方便地存储到磁盘或者通过网络传输

------