hadoop介绍

1，hadoop:由Apache基金会所开发的分布式系统基础架构。

2，hadoop特点：

3，hadoop框架的核心设计：

4，hadoop的优点：

5，hadoop大数据处理的意义：

hadoop得以在大数据处理应用中的广泛，得益于自身在数据提取，变形和加载的天然优势，hadoop的分布式框架，将大数据引擎尽可能的靠近存储，对例如像加载（elt）这样的批处理操作相对合适，类似于这样的操作批处理结果可以直接走向存储。hadoop中的mapreduce功能实现了将单个任务打碎，并将碎片任务（map）发送到多个节点上，最后在一单个数据集的形式加载（reduce）到数据仓库中。

6，hadoop核心架构图：

7,HDFS架构是基于一组特定的节点构建的，参考上图即可，因为仅存在与一个namenode，因此这是hadoop的一个缺点（单点失败）。HDFS的NameNode和DataNode

NameNode：通常是在一个HDFS实例中单独机器上运行的软件。
- 它负责处理文件系统名称和控制客户外部机的访问
DataNode:通常也是在HDFS实例中单独机器上运行的软件
- hadoop集群包含一个NameNode和大量DataNode，DataNode通常以几家的形式组织，机架通常以交换机将所有的系统链接起来。hadoop的一个假设就是：机架内部节点之间的传输速度快于机架间节点的传输速度

8，文件操作

9，MapReduce: