集群中各个进程

ha:

  NameNode:是整个文件系统的管理节点。它维护着

                         1.整个文件系统的文件目录树

                         2.文件/目录的元信息和每个文件对应的数据块列表。

                         3.接收用户的操作请求。

  DataNode:提供真实文件数据的存储服务。

  JournalNode:NameNode之间共享数据

  DFSZKFailoverController:它负责整体的故障转移控制等。它是一个守护进程


yarn

  ResourceManager:负责集群中所有资源的统一管理和分配,它接收来自各个节点(NodeManager)的资源汇报信息,并把这些信息按照一定的策略分配给各个应用程序  

  NodeManager:每台机器上的代理,负责容器管理,并监控它们的资源使用情况

  

  


zookeeper

  QuorumPeerMain:这是QuorumPeerMain是zookeeper集群的启动入口类,是用来加载配置启动QuorumPeer线程的。


HBase

  HRegionServer:

    1)监控 RegionServer

    2)处理 RegionServer 故障转移

    3)处理元数据的变更

    4)处理 region 的分配或移除

    5)在空闲时间进行数据的负载均衡

    6) 通过 Zookeeper 发布自己的位置给客户端

  HMaster:

    1) 负责存储 HBase 的实际数据

    2) 处理分配给它的 Region

    3) 刷新缓存到 HDFS

    4) 维护 HLog

    5) 执行压缩

原文地址:https://www.cnblogs.com/fax1996/p/10022243.html