hadoop学习笔记（八）：hadoop2.x的高可用环境搭建

本文原创，转载请注明作者及原文链接

高可用集群的搭建：

几个集群的启动顺序问题：

1、先启动zookeeper --->zkServer.sh start

2、启动journalNodes集群 --->hadoop-daemon.sh start journalnode

也就是主结点nameNode的纵向扩展，为了克服单点故障灯问题，（要和联邦区分开，联邦是nameNode的横向扩展，为了克服一个从结点太多，一个主结点管理不过来的问题）

配置集群唯一的服务名称nameserverce ID ,整个集群的唯一标识符

<property>
  <name>dfs.nameservices</name>
  <value>mycluster</value>
</property>

配置HA集群中的两个NameNode

<property>
  <name>dfs.ha.namenodes.mycluster</name>
  <value>nn1,nn2</value>

 #特别的注意的是其中的nn1、nn2只是逻辑名称，而不是你的主机节点名，通过这个逻辑名称，是找不到具体的主机位置的

配置的两个主结点的逻辑名称到物理结点的映射端口默认是8020

<property>
  <name>dfs.namenode.rpc-address.mycluster.nn1</name>
  <value>node01:8020</value>
</property>
<property>
  <name>dfs.namenode.rpc-address.mycluster.nn2</name>
  <value>node02:8020</value>
</property>

其中的node01和node02是高可用集群中打算配置成两个主结点的两个结点

配置浏览器访问集群所访问的主机和port,端口默认是50070

<property>
  <name>dfs.namenode.http-address.mycluster.nn1</name>
  <value>node01:50070</value>
</property>
<property>
  <name>dfs.namenode.http-address.mycluster.nn2</name>
  <value>node02:50070</value>
</property>

配置JournalNode集群中的各个结点所放置的物理位置

对于journalNodes这个集群,在每一个hdfs集群中的hdfs.site.xml文件中的配置项的作用解释

这个位置，可以随便的去写，这就是为了在journalNode集群中，新建一个目录去存储当前的所更改的hdfs.site.xml文件所在的集群的所有的edits log文件，因为对于这个日志集群可以存储多个集群的日志文件，对于每一个集群的话，都设置一个单独的文件，更好的去分清楚某一个集群的日志文件具体的存储于哪里！！

下面的

mycluster是一个hdfs集群的唯一的nameservice ID

<property>
  <name>dfs.namenode.shared.edits.dir</name>
  <value>qjournal://node01:8485;node2:8485;node3:8485/mycluster</value>   #上面的解释是指的这句话中的mycluster的作用，且mycluster是一个hdfs集群的唯一的nameservice ID
</property>

配置 NameNode的故障转移所需要的那个类（java代码）

<property>
  <name>dfs.client.failover.proxy.provider.mycluster</name>
  <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

配置出问题的那个NameNode状态隔离的一个方式

<property>
  <name>dfs.ha.fencing.methods</name>
  <value>sshfence</value>           #指定的是以ssh远程登录的形式来隔离down掉的NameNode结点
</property>

<property>
  <name>dfs.ha.fencing.ssh.private-key-files</name>
  <value>/root/.ssh/id_dsa</value>   #配置那个曾经的active NameNode结点自己的私钥的存放路径
</property>

配置了这个之后，就可以实现当一个主结点出现问题的时候，立刻的将他阻塞隔离，而将另一个变成Active的主结点,就不会存在当当前的那个主结点出现问题了之后仍然还会继续的接收client发过来的指令了，也就是当一个主结点坏掉之后，立马的被隔离掉，另一个steady的主结点变成Active状态

配置私钥的时候注意点:

注意这里是为了告诉那个standy NameNode结点想要登录另一个Active结点的话，另一个结点的私钥文件的位置
为什么这里设置成/root/.ssh/id_dsa因为，~/.ssh/id_dsa也就是说~就是指的是root用户的根目录

配置journalNode中的日志文件存放的位置

<property>
  <name>dfs.journalnode.edits.dir</name>
  <value>/var/sxt/hadoop/ha/journalnode</value>
</property>

到此位置，%95的完成了高可用集群的搭建，只是现在的故障切换只能手工去做，如果想要自动故障转移的完成的话，需要一个zookper集群的辅助

下面配置zookeeper集群

zookeeper集群是怎么和主结点交互的

zookeeper集群的功能：1、故障检测(Failure detection)：检测已经在当前已经在zookeeper中注册的结点是否正常，具体NameNode的注册是通过进行注册的

　　　　　　　　　　 2、主结点注册， Active NameNode election 通过这个进程其中一个主结点来注册成Active NameNode

　 3、函数回调调用的是zookeeper在两个namenode中启动JKFC进程中的函数（The ZKFailoverController）

　　官方介绍：

Failure detection - each of the NameNode machines in the cluster maintains a persistent session in ZooKeeper. If the machine crashes, the ZooKeeper session will expire, notifying the other NameNode that a failover should be triggered.
Active NameNode election - ZooKeeper provides a simple mechanism to exclusively elect a node as active. If the current active NameNode crashes, another node may take a special exclusive lock in ZooKeeper indicating that it should become the next active.

The ZKFailoverController (ZKFC) is a new component which is a ZooKeeper client which also monitors and manages the state of the NameNode. Each of the machines which runs a NameNode also runs a ZKFC, and that ZKFC is responsible for:

Health monitoring （健康监控，如果不健康了就向zookeeper汇报，）- the ZKFC pings its local NameNode on a periodic basis with a health-check command. So long as the NameNode responds in a timely fashion with a healthy status, the ZKFC considers the node healthy. If the node has crashed, frozen, or otherwise entered an unhealthy state, the health monitor will mark it as unhealthy.
ZooKeeper session management - when the local NameNode is healthy, the ZKFC holds a session open in ZooKeeper. If the local NameNode is active, it also holds a special "lock" znode. This lock uses ZooKeeper's support for "ephemeral" nodes; if the session expires, the lock node will be automatically deleted.
ZooKeeper-based election（zookeeper的Active结点的参选机制） - if the local NameNode is healthy, and the ZKFC sees that no other node currently holds the lock znode, it will itself try to acquire the lock. If it succeeds, then it has "won the election", and is responsible for running a failover to make its local NameNode active. The failover process is similar to the manual failover

在相应的文件中进行配置

集群结点的zookeeper的配置

 <property>
   <name>dfs.ha.automatic-failover.enabled</name>
   <value>true</value>
 </property>



<property>
   <name>ha.zookeeper.quorum</name>
   <value>zk1.example.com:2181,zk2.example.com:2181,zk3.example.com:2181</value>
 </property>

所有的配置项完成之后，进行分发其他的几个未配置这两个文件的结点之上

[root@node01 hadoop]# scp hdfs-site.xml core-site.xml node02:`pwd`
hdfs-site.xml                                                                                
core-site.xml                                                                                
[root@node01 hadoop]# scp hdfs-site.xml core-site.xml node03:`pwd`
hdfs-site.xml                                                                                
core-site.xml                                                                                
[root@node01 hadoop]# scp hdfs-site.xml core-site.xml node04:`pwd`

下面真正在要搭建zookeeper集群的结点上上传解压安装配置zookeeper

上传zookeeper压缩包

解压安装

配置：重命名文件
```
vi zoo.cfg 
```

[root@node02 conf]# mv zoo_sample.cfg zoo.cfg
[root@node02 conf]# vi zoo.cfg

在这个配置文件中还需要告诉zookeeper有几个结点参与集群的搭建，这是zookeeper的特殊点，搭建之前必须配置告诉有多少台参与

2888端口号是zookeeper服务之间通信的端口。

3888端口是zookeeper与其他应用程序通信的端口。

2181端口是zookeeper客户端请求接口。

server.1=node02:2888:3888            #2888和3888分别是通信端口
server.2=node03:2888:3888
server.3=node04:2888:3888

将zookeeper集群中配置好配置文件的Node02中的zookeeper。。。文件夹分发到其他的两个结点

[root@node02 sxt]# scp -r zookeeper-3.4.6/ node03:`pwd`

创建目录（是在zookeeper的conf的zoo.cfg中设置的位置），设置服务器编号，必须是数字，不能是字母！！！

结点node02中设置ID为1

,zoo.cfg配置文件里dataDir指定的那个目录下创建myid文件,并且指定id,改id为你zoo.cfg文件中server.1=ip:2888:3888中的1.只要在myid头部写入1即可.同理其它两台机器的id对应上

[root@node02 ~]# echo 1 > /var/sxt/zk/myid

结点node03中设置ID为2

[root@node03 sxt]# echo 2 > /var/sxt/zk/myid

结点node04中设置ID为3

[root@node04 sxt]# echo 3 > /var/sxt/zk/myid

配置环境变量

#myadd

export JAVA_HOME=/opt/soft/jdk1.8.0_144
export JRE_HOME=${JAVA_HOME}/jre  
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib  
export  PATH=${JAVA_HOME}/bin:$PATH
export HADOOP_HOME=/opt/sxt/hadoop-2.6.5
export ZOOKEEPER_HOME=/opt/sxt/zookeeper-3.4.6
PATH=$PATH:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:${ZOOKEEPER_HOME}/bin

之后source /etc/profile 重新的读一下环境变量的配置文件

zookeeper集群搭建完毕！

启动zookeeper