Hadoop单机模式和伪分布式搭建教程CentOS


1. 安装JAVA环境

2.

Hadoop下载地址:

http://archive.apache.org/dist/hadoop/core/

tar -zxvf hadoop-2.6.0.tar.gz -C /usr/local 

mv hadoop-2.6.0/ hadoop/   #更改文件夹名称

chown -R hadoop:hadoop ./hadoop   #修改权限 

验证单机模式是否安装成功,进入/usr/local/hadoop/bin目录下,执行./hadoop -version 

vi /etc/hosts  修改主机名 ip映射

为了便于Hadoop的操作,我们在为hadoop用户添加环境变量

 伪分布式安装

修改 core-site.xml

<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/hadoop/tmp</value>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://hd3:9000</value>
</property>
</configuration>

修改hdfs-site.xml

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/tmp/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/tmp/dfs/data</value>
</property>

</configuration>

修改 hadoop-env.sh

加入

 修改yarn-env.sh

加入

export JAVA_HOME=/usr/local/jdk1.7.0_80
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"

启动hadoop

                先启动HDFS

                    start-dfs.sh

再启动YARN

    start-yarn.sh

安装Hadoop启动之后总有警告:Unable to load native-hadoop library for your platform... using builtin-Java classes where applicable

原因:
Apache提供的hadoop本地库是32位的,而在64位的服务器上就会有问题,因此需要自己编译64位的版本。

1、首先找到对应自己hadoop版本的64位的lib包,可以自己手动去编译,但比较麻烦,也可以去网上找,好多都有已经编译好了的。

2、可以去网站:http://dl.bintray.com/sequenceiq/sequenceiq-bin/  下载对应的编译版本

3、将准备好的64位的lib包解压到已经安装好的hadoop安装目录的lib/native 和 lib目录下:

 

tar -xvf hadoop-native-64-2.7.0.tar -C hadoop-2.7.2/lib/native  

     


4、然后增加环境变量:

 
  1. [hadoop@hadoopTest hadoop-2.7.2]$ vi /etc/profile  

增加下面的内容:

 
  1. export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native  
  2. export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"  

让环境变量生效

 

 source /etc/profile  

 

原文地址:https://www.cnblogs.com/lanblogs/p/6293055.html