Hadoop为什么不用JavaSetialization?

1、首先序列化应满足的格式标准:精简、快速、可扩展、支持互操作

2、java后续实例只引用第一次出现的句柄,句柄占5个字节;而句柄引用不适用于随机访问;更大问题的是句柄引用会对序列化数据流中的排序记录造成巨大破坏。

  而不把类名写到数据流中可以避免上述问题;

3、hadoop流中的每一条记录均独立于其他记录

4、hadoop序列化不需要为新建对象分配空间而得到存储节省是非常可观的;

原文地址:https://www.cnblogs.com/pingzhanga/p/4680007.html