hadoop 集群间数据迁移

    hadoop集群之间有时候需要将数据进行迁移,如将一些保存的过期文档放置在一个小集群中进行保存。

    使用的是社区提供的功能,distcp。用法非常简单:

    hadoop distcp hdfs://nn1:8020/foo/bar  hdfs://nn2:8020/bar/foo

    加上参数 -i 表示不用去管failure -m 设置map数

原文地址:https://www.cnblogs.com/sidmeng/p/2428283.html