CentOS系统下Hadoop、Hbase、Zookeeper安装配置

近期给一个项目搭建linux下的大数据处理环境,系统是CentOS 6.3。主要是配置JDK。安装Tomcat,Hadoop、HBase和Zookeeper软件。博主在Hadoop这方面也是新手。配置这个环境遇到过很多问题。查了很多资料。这里做一个总结。以便日后回想。


首先是账户权限的改动,安装软件环境须要上传文件和一些系统文件的改动权限,所以最好设置成root权限

权限改动方法:http://www.linuxidc.com/Linux/2012-03/55629.htm

软件的安装。网上有很多这方面的文章:

安装JDK:http://www.cnblogs.com/zhoulf/archive/2013/02/04/2891608.html

安装Tomcat:http://www.cnblogs.com/zhoulf/archive/2013/02/04/2891633.html

安装Hadoop:http://www.cnblogs.com/xia520pi/archive/2012/05/16/2503949.htmlhttp://bjbxy.blog.51cto.com/854497/352692

安装HBase:http://blog.csdn.net/21aspnet/article/details/18776833

安装zookeeper:http://www.cnblogs.com/ilovexiao/p/3946547.html

配置Hadoop和Hbase:http://lovesoo.org/hadoop-hbase-deployment-guide.html


在安装Hadoop和Hbase之前须要选择下载相相应的正确的版本号(博主选择的是hadoop1.0.0+hbase0.94.22),能够查阅官方文档选择http://abloz.com/hbase/book.html,同一时候很多Hbase的配置也能够在文档中看到。


在配置Hadoop和Hbase的时候非常重要的一个就是主机名。也就是hostname。这个非常重要。我在原本配置好的server上改动了hostname。出现了一系列的问题,怎么改都有问题(心碎啊),最后发如今改动过hostname以后须要先清空tmp以下的数据,然后format Hadoop的namenode的数据,详细如:http://www.07net01.com/storage_networking/hadoopanzhuangbushuyudaowenti_guzhangpaicha_90974_1363776317.html


在配置软件环境的过程中会遇到很多问题,能够通过查看hadoop、hbase和zookeeper的日志文件来了解问题所在,然后做出改动调整,一般都能解决。


在配置好环境后,測试程序,发现数据存入server之后,再读取出来却是乱码,在windows下測试没问题。这就是server的编码有问题,能够将server的编码改成GB2312或者GBK,详细的改动方式如:http://blog.sina.com.cn/s/blog_697b96890101jdxj.html


假设重新启动server之前没有关闭Hadoop和hbase,则server重新启动后,hadoop会进入safe模式。须要关闭才干又一次使用hbase及其命令。

http://blog.chinaunix.net/uid-451-id-3189503.html?

/12715.html

原文地址:https://www.cnblogs.com/cynchanpin/p/6889234.html