Hadoop之序列化

1.序列化(Serialization)是指把结构化对象转化为字节流。 -写到内存

2.反序列化(Deserialization)是序列化的逆过程。即把字节流转回结构化对象。-读到内存

3.Java序列化(java.io.Serializable)

java Serializable 是标志接口,在使用的时候只要.serializable 。java内部已经实现序列化。

java序列化会把父类的所有类都序列化。而为了减少这种冗余,hadoop 有专门的序列化。

4. hadoop 的序列化

必须实现writable接口

Writable接口, 是根据 DataInput 和 DataOutput 实现的简单、有效的序列化对象.

MapReduce的任意Key和Value必须实现Writable接口

image

MapReduce的任意key必须实现WritableComparable接口

image

5. java 基本类型与hadoop 类型的对应

image

6. Writabel集成体系

image

岁月里,寒暑交替。人世间,北来南往。铭心的,云烟的。都付往事,不念,不问。
原文地址:https://www.cnblogs.com/chaoren399/p/2824854.html