hadoop高可用集群环境详解

YD~随风

原理简解

hadoop

组成：HDFS, MapReduce

hdfs 分布式文件系统

流式数据访问 hdfs的构建思路是一次写入、多次读取是最高效的访问模式

hdfs同样也有快（block）的概念，但是大的多，默认为64MB。与单一磁盘上的文件系统相似，hdfs上的文件也被划分为块大小的多个分块

作为独立的存储单元。但与其他文件系统不同的是，hdfs中小于一个块大小的文件不会占据整个块的空间

hdfs中的块为何如此之大：hdfs的块比磁盘的块大，其目的是为了最小化寻址开销，如果块设置得足够大，从磁盘传输数据的时间会明显

大于定位整个块开始位置所需的时间，因而，传输一个由多个块组成的文件的时间取决于磁盘传输速率

namenode 和 datanode

hdfs集群有两类节点以管理者-工作者模式运行，即一个namenode（管理者）和多个datanode（工作者）。namenode管理文件系统的命名空间。

它维护着文件系统树及整棵树内所有的文件和目录。这些信息以两个文件形式永久保存在本地磁盘上：命名空间镜像文件和编辑日志文件。namenode也

记录着每个文件中各个块所在的数据节点信息，但它并不永久保存块的位置信息，因为这些信息会在系统启动时由数据节点重建

基于后面的两个，之后在研究

其实说白了，hdfs里面有namenode 和 datanode ，namenode为命名空间，也是master，下发任务，datenode为数据节点，专门干活，执行任务存数据

不过这样看，有单点问题，

hadoop中的namenode好比人的心脏，绝对不可以停止工作，在hadoop2.0中新的namenode不再是一个，可以有多个（目前只支持2个）

每一个都有相同的职能，一个是active状态的，一个是standby状态的，当集群运行时，只有active状态的namenode是正常工作的，standby

状态的namenode是处于待命状态的，时刻同步active状态namenode的数据。一旦active状态的namenode不能工作，通过手工或者自动切换，

standby状态的namenode就可以转变为active状态的，就可以继续工作了，

hadoop2.0中，两个namenode的数据其实是实时共享的，新hdfs采用了一种共享机制，Quorum Journal Node（JournalNode）集群或者

NFS进行共享，nfs是操作系统层面的，journalnode是hadoop层面的我们这里使用journalnode集群

两个NameNode为了数据同步，会通过一组称作JournalNodes的独立进程进行相互通信。当active状态的NameNode的命名空间有任何修改时，

会告知大部分的JournalNodes进程。standby状态的NameNode有能力读取JNs中的变更信息，并且一直监控edit log的变化，把变化应用于自己

的命名空间。standby可以确保在集群出错时，命名空间状态已经完全同步了

对于HA集群而言，确保同一时刻只有一个NameNode处于active状态是至关重要的。否则，两个NameNode的数据状态就会产生分歧，可能丢失

数据，或者产生错误的结果。为了保证这点，这就需要利用使用ZooKeeper了。首先HDFS集群中的两个NameNode都在ZooKeeper中注册，

当active状态的NameNode出故障时，ZooKeeper能检测到这种情况，它就会自动把standby状态的NameNode切换为active状态

我这里是做了4台。这里我说一下，这个journalnode最少三台，也就是最起码是奇数，数据节点也弄三台吧

namenode datanode zookeeper year journalnode

192.168.10.36 hadoop-master-01 是否是否否

192.168.10.39 hadoop-master-03 是是是是是

192.168.10.37 hadoop-slave-01 否是是否是

192.168.10.38 hadoop-slave-02 否是否否是

前期的环境都弄好，我这里系统是centos7，我将自带的java卸了，自己装了一个

jdk-8u72-linux-x64.rpm

环境变量配好

export JAVA_HOME=/usr/java/jdk1.8.0_72

export CLASSPATH=.:$JAVA_HOME/jreb/rt.jar:$JAVA_HOMEb/dt.jar:$JAVA_HOMEb/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

好了，准备好，那就开始zookeeper。

我们看看配置文件

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/usr/local/zookeeper-3.4.6/data

clientPort=2181

dataLogDir=/tmp/zookeeper/log

server.1=hadoop-master-01:2888:3888

server.2=hadoop-master-03:2888:3888

server.3=hadoop-slave-01:2888:3888

后面别忘了创建那个小文件

好了，zk完了，

开始hadoop。

wget http://apache.fayea.com/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz

hadoop-2.7.2.tar.gz 最新版本

对了，ssh免密码登陆，这个别忘，因为Hadoop需要通过SSH登录到各个节点进行操作

(1)CentOS默认没有启动ssh无密登录，去掉/etc/ssh/sshd_config其中2行的注释，每台服务器都要设置，
#RSAAuthentication yes
#PubkeyAuthentication yes
(2)输入命令，ssh-keygen -t rsa，生成key，都不输入密码，一直回车，/root就会生成.ssh文件夹，

然后将公钥拷贝到其他机器上生成authorized_keys

测试一下

好了，解包hadoop

创建几个数据目录在/home/hadoop data name temp

我们开始看配置

这里要涉及到的配置文件有7个：

~/hadoop-2.7.2/etc/hadoop/hadoop-env.sh export JAVA_HOME=/usr/java/jdk1.8.0_72 我直接在这个文件里修改了一下环境变量

~/hadoop-2.7.2/etc/hadoop/yarn-env.sh 这个也是环境的一些配置

~/hadoop-2.7.2/etc/hadoop/slaves 这个里面是很明显，都是slave，datanode，

~/hadoop-2.7.2/etc/hadoop/core-site.xml 这里是namenode的配置文件

~/hadoop-2.7.2/etc/hadoop/hdfs-site.xml hdfs的配置文件

~/hadoop-2.7.2/etc/hadoop/mapred-site.xml mapreduce

~/hadoop-2.7.2/etc/hadoop/yarn-site.xml yarn的配置

/usr/local/hadoop/etc/hadoop/core-site.xml

<name>fs.defaultFS</name>

<value>hdfs://ns</value> 这里定义namenode，他的数据目录

</property>

<name>hadoop.tmp.dir</name>

<value>file:/home/hadoop/temp</value>

<description>Abase for other temporary directories.</description>

</property>

<name>ha.zookeeper.quorum</name> 以及注册与zk的配置

<value>hadoop-master-01:2181,hadoop-master-03:2181,hadoop-slave-01:2181</value>

</property>

</configuration>

vi /usr/local/hadoop/etc/hadoop/hdfs-site.xml

<name>dfs.nameservices</name>

</property>

<name>dfs.ha.namenodes.ns</name>

</property>

<name>dfs.namenode.rpc-address.ns.nn1</name>

<value>hadoop-master-01:9000</value>

</property>

<name>dfs.namenode.http-address.ns.nn1</name>

<value>hadoop-master-01:50070</value>

</property>

<name>dfs.namenode.rpc-address.ns.nn2</name>

<value>hadoop-master-03:9000</value>

</property>

<name>dfs.namenode.http-address.ns.nn2</name>

<value>hadoop-master-03:50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hadoop-master-03:8485;hadoop-slave-01:8485;hadoop-slave-02:8485/ns</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/home/hadoop/journal</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

<name>dfs.client.failover.proxy.provider.ns</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

</property>

<name>dfs.namenode.name.dir</name>

<value>file:///home/hadoop/name</value>

</property>

<name>dfs.datanode.data.dir</name>

<value>file:///home/hadoop/data</value>

</property>

<name>dfs.replication</name>

</property>

<name>dfs.webhdfs.enabled</name>

</property>

这里的配置就是允许它用户连接

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

/usr/local/hadoop/etc/hadoop/mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

</configuration>

/usr/local/hadoop/etc/hadoop/yarn-site.xml

<name>yarn.resourcemanager.hostname</name>

<value>hadoop-master-03</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

vi /usr/local/hadoop/etc/hadoop/slaves

hadoop-master-03

hadoop-slave-01

hadoop-slave-02

然后将本机的 hadoop 直接拷贝到其他机器。什么防火墙啊。。。主机名啊都改好

192.168.10.36 hadoop-master-01

192.168.10.37 hadoop-slave-01

192.168.10.38 hadoop-slave-02

192.168.10.39 hadoop-master-03

开始启动。

在master1上

启动journalnode集群

sbin/hadoop-daemons.sh start journalnode

bin/hadoop-daemons.sh start journalnode

执行jps命令，可以查看到JournalNode的java进程pid

格式化zkfc,让在zookeeper中生成ha节点

在master1上

hdfs zkfc –formatZK

[zk: localhost:2181(CONNECTED) 1] ls /hadoop-ha

[ns]

在master1上因为有两个namnode。这台格式化后，将数据同步到另一台上，手动考培，或者执行命令

格式化hdfs

hadoop namenode –format

用命令同步，得先把目前这台启动起来

sbin/hadoop-daemon.sh start namenode

然后来到第二台namenode master-03 执行

hdfs namenode -bootstrapStandby 同步

然后开启 sbin/hadoop-daemon.sh start namenode

然后继续启动datanode 在master1

sbin/hadoop-daemons.sh start datenode

然后启动yarn 在你所配置yarn的那台机器上启动，

sbin/start-yarn.sh

最后启动zkfc

sbin/hadoop-daemons.sh start zkfc

ok，我们最后看jps

测试

我创建了文件夹以及文件测试

好的，hadoop就算搭建完了，不过路还长！！！