注意
1. 64bit的hadoop需要自己编译
2. 供编译用的hadoop.src文件本身有bug,需要加两条dependency
hadoop的缺省端口
50030 mapred.job.tracket.http.address
JobTracker administrative web GUI JOBTRACKER的HTTP服务器和端口
50070 dfs.http.address
描述:NameNode administrative web GUI NAMENODE的HTTP服务器和端口
50010 dfs.http.address
描述:NameNode administrative web GUI NAMENODE的HTTP服务器和端口
50020 dfs.datanode.ipc.address
描述:DataNode IPC port, used for block transfer DATANODE的RPC服务器地址和端口
50060 mapred.task.tracker.http.address
描述:Per TaskTracker web interface TASKTRACKER的HTTP服务器和端口
50075 dfs.datanode.http.address
描述:Per DataNode web interface DATANODE的HTTP服务器和端口
50090 dfs.secondary.http.address
描述:Per secondary NameNode web interface 辅助DATANODE的HTTP服务器和端口
连接到 hadoop 的web
localhost:50070
filesystem的内容,namenode的log以及其他的信息都可以通过web可见
安装完毕后,开启hadoop
bin/start-all.sh 如果bin已经放入环境变量中,那么直接start-all.sh即可
通过jps(java ps)查看正在运行的进程,可以看到6个则开启成功。
hadoop的常用操作命令