Hadoop概论

1、Hadoop核心项目:HDFS(分布式文件系统)和MapReduce(并行计算框架)

2、HDFS的架构

  主从结构

    主节点,只有一个:namenode(接受用户操作要求;维护文件系统的目录结构;管理文件与block之间关系,block与datanode之间关系)

    从节点,有很多个:datanodes(存储文件;文件被分成block存储在磁盘上;为保证数据安全,文件会有多个副本)

3、MapReduce的架构

  主从结构

    主节点,只有一个:JobTracker(接受客户提交的计算任务;把计算分给TaskTracker执行;监控TaskTracker的执行情况)

    从节点,有很多个:TaskTrackers(执行JobTracker分配的计算任务)

原文地址:https://www.cnblogs.com/chamie/p/4681416.html