Hadoop完全分布式环境部署

Hadoop完全分布式环境部署

Hadoop的集群规划
前置安装
JDK安装
Hadoop集群部署

1. Hadoop的集群规划

　　前面我们都了解了Hadoop和Yarn的运行原理和架构，

　　Hadoop包含：NameNode，DataNode，SeconderNameNode节点

　　Yarn包含：ResourceManage NodeManger节点

　　集群规划：

分别设置他们的主机名(vi /etc/sysconfig/network)，
设置后重启LinuX
分别根据节点的方式配置ip地址(子节点跟主节点在同一节点上)
vi /etc/sysconfig/network-scripts/ifcfg-eth0
设置主节点和子节点之间的ip和主机名的映射关系
vi /etc/hosts 主节点排第一，依次往下
关闭子节点防火墙 (chkconfig iptables off)

2.前置安装

ssh免密登陆

每台机器执行：ssh-keygen -t rsa 命令
在主节点执行：ssh-copy-id -i ~/.ssh/id-rsa.pub 节点名(主机名)
验证：在主节点使用：ssh 子节点名 (如果不需要密码则配置成功)

3.JDK安装

设置子节点的目录结构
在主节点执行：拷贝主节点jdk压缩包的路径到各个子节点中(scp -r jdk路径用户名@主机名：~/目录地址)
在各个子节点配置环境变量（vi /etc/profile）

4.Hadoop集群的部署

在主节点修改slaves文件(vi /etc/slaves)
把各个子节点相关的配置文件，环境变量修改下
在主节点格式化Hadoop（hadoop namenode -format）
在主节点启动HDFS
在主节点启动YARN
查看各个节点进程：sbin目录下执行jps

　　主节点：

1. Jps
2. SecondaryNameNode
3. NodeManager
4. NameNode
5. ResourceManager
6. DataNode

　　子节点：

1. Jps
2. DataNode
3. NodeManager

5.验证是否成功：

　　进到hadoop中的share/hadoop/mapreduce 执行命令：

出现：Estimated value of Pi is 4.000000000 表示成功

常见错误及解决办法：

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/wyk1/p/13941818.html