“数据迁移”考虑

1、hortonwork 和 cloudera 比较

  除了功能,还需要对维护性能进行比较

2、环境部署需要细化

  部署哪些组件

  部署哪些webservice服务

  各节点之间如何规划

  内存磁盘资源如何分配

  是否开启组件高可用

  若开启组件高可用,是否考虑部署2套zookeeper

  离线集群与在线集群如何互通

3、大数据组件中存储列表应该列出

  列出存储的表

  给出各表的数据逻辑,即从和数据源来,可如何使用

  是否需要考虑历史数据,是否考虑使用拉链表

4、数据迁移方案需要优化

  迁移时是否需要停服务  (NO)

  哪些数据需要迁移,哪些可以考虑不迁移

  mysql中的数据如何迁移

  hive、hbase、hdfs中数据如何迁移

  为什么使用sqoop

  为什么不用distcp

  迁移的持续时间预估

  迁移后如何进行验证

原文地址:https://www.cnblogs.com/llphhl/p/5767616.html