CentOS7.4搭建kafka单结点和集群

 

 

操作系统选择

  CentOS7.4x86-64(操作系统的x86_64是跟CPU有关的,最早AMD公司开发出了一款向下兼容x86CPU,向上又扩充了指令集,具有了64位CPU的特性,这款CPU后来改名为AMD64,Intel在AMD之后也开发了这样一款CPU,取名叫做x86_64),所以操作系统的x86_64就是指这款操作系统是64位的。使用uname -a查看操作系统版本。

安装Java环境

  首先找到jdk下载的官网网址,然后在你要下载的jdk版本上右键单击,在弹出的选择框选择复制链接,得到jdk11的下载链接为:http://download.oracle.com/otn-pub/java/jdk/11+28/55eed80b163941c8885ad9298e6d786a/jdk-11_linux-x64_bin.tar.gz

  在/usr/目录下创建java目录,使用wget命令下载jdk安装包到当前目录,命令为:(因为jdk下载时需要接收协议,所以wget命令比较特别)

wget --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie;"  http://download.oracle.com/otn-pub/java/jdk/11+28/55eed80b163941c8885ad9298e6d786a/jdk-11_linux-x64_bin.tar.gz

  下载好了以后可以使用ls命令查看这个安装包是否下载成功了。接下来使用tar命令解包

tar -zxvf jdk-11_linux-x64_bin.tar.gz

  然后,配置java环境,就是windows下的环境变量的配置,打开/etc/profile文件,在最下方插入下面两行:

export JAVA_HOME=/usr/java/jdk-10.0.2   //这个就是你的包解压后的结果
export PATH=$JAVA_HOME/bin/:$PATH

  最后,输入source /etc/profile,强制刷新配置文件。然后输入java -version即可查看你所安装的jdk的版本号,在本次试验中我的java版本是jdk10。

安装Zookeeper

  Kafka使用Zookeeper保存集群的元数据信息和消费者信息。Kafka发行版本自带了Zookeeper,可以直接从脚本启动。本例安装一个完整的Zookeeper。

  元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。

  元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据

  从apache.org下载Zookeeper的稳定版,下载地址为:http://mirrors.hust.edu.cn/apache/zookeeper/stable/zookeeper-3.4.12.tar.gz。版本为3.4.12。

1.单机Zookeeper的安装

  Zookeeper的安装目录为/usr/local/zookeeper。数据目录为/var/lib/zookeeper。

  下载Zookeeper的安装包:

wget http://mirrors.hust.edu.cn/apache/zookeeper/stable/zookeeper-3.4.12.tar.gz

  解压安装包

tar -zxf zookeeper-3.4.12.tar.gz 

  创建数据目录

mkdir -p /var/lib/zookeeper

  创建Zookeeper的配置文件,并填写内容

[root@CentOs64-7 zookeeper]# mkdir -p /var/lib/zookeeper
[root@CentOs64-7 zookeeper]# cat > /usr/local/zookeeper/zookeeper-3.4.12/conf/zoo.cfg << EOF
> tickTime = 2000
> dataDir=/var/lib/zookeeper
> clientPort=2181
> EOF

   最后zookeeper完整的配置文件内容为

#Zookeeper定义的基准时间间隔,单位:毫秒。服务器与客户端之间交互的基本时间单元,也就是Zookeeper服务器之间或服务器与客户端之间每隔一个tickTime就发送一次心跳
tickTime=2000
#数据目录,zookeeper保存数据的目录,默认情况下,Zookeeper将写数据的日志文件也保存在这个目录下
dataDir=/var/lib/zookeeper
#客户端访问zookeeper的端口号,Zookeeper会监听这个端口,接收客户端的访问请求
clientPort=2181
#集群中的Follower(F)服务器和Leader(L)服务器之间初始连接时能容忍的最多心跳数(即tickTime的数目)
initLimit=5
#syncLimit:Leader-Follower同步通信时限,集群中的follower服务器与leader服务器之间请求和应答之间能容忍的最多心跳数(即tickTime的数量)
syncLimit=2

   启动通过脚本启动zookeeper,命令为:

 /usr/local/zookeeper/zookeeper-3.4.12/bin/zkServer.sh start
 // start 前的目录路径为脚本的保存路径,它在你的zookeeeper的安装目录下

  执行结果如下:

  如上所示:说明单机版的zookeeper就已经启动了。其它一些ookeeper的命令:

1.查询 zookeeper 状态:
zkServer.sh status
2.关闭 zookeeper 服务:
    zkServer.sh stop
    如打印如下信息则表明成功关闭:
    ZooKeeper JMX enabled by default
    Using config: /usr/local/services/zookeeper/zookeeper-3.4.9/bin/../conf/zoo.cfg
    Stopping zookeeper ... STOPPED

3.重启 zookeeper 服务:
    zkServer.sh restart
    如打印如下信息则表明重启成功:
    ZooKeeper JMX enabled by default
    Using config: /usr/local/services/zookeeper/zookeeper-3.4.9/bin/../conf/zoo.cfg
    ZooKeeper JMX enabled by default
    Using config: /usr/local/services/zookeeper/zookeeper-3.4.9/bin/../conf/zoo.cfg
    Stopping zookeeper ... STOPPED
    ZooKeeper JMX enabled by default
    Using config: /usr/local/services/zookeeper/zookeeper-3.4.9/bin/../conf/zoo.cfg
    Starting zookeeper ... STARTED
1.查询 zookeeper 状态:
zkServer.sh status
2.关闭 zookeeper 服务:
    zkServer.sh stop
    如打印如下信息则表明成功关闭:
    ZooKeeper JMX enabled by default
    Using config: /usr/local/services/zookeeper/zookeeper-3.4.9/bin/../conf/zoo.cfg
    Stopping zookeeper ... STOPPED

3.重启 zookeeper 服务:
    zkServer.sh restart
    如打印如下信息则表明重启成功:
    ZooKeeper JMX enabled by default
    Using config: /usr/local/services/zookeeper/zookeeper-3.4.9/bin/../conf/zoo.cfg
    ZooKeeper JMX enabled by default
    Using config: /usr/local/services/zookeeper/zookeeper-3.4.9/bin/../conf/zoo.cfg
    Stopping zookeeper ... STOPPED
    ZooKeeper JMX enabled by default
    Using config: /usr/local/services/zookeeper/zookeeper-3.4.9/bin/../conf/zoo.cfg
    Starting zookeeper ... STARTED

现在可以连接到Zookeeper端口上,通过发送四字命令srvr是否安装正确。使用命令:

  此时终端会停在这里,它是在等待你的输入。我们发送srvr,得运行结果如下:

[root@CentOs64-7 ~]# telnet localhost 2181
Trying 127.0.0.1...
Connected to localhost.
Escape character is '^]'.
srvr
Zookeeper version: 3.4.12-e5259e437540f349646870ea94dc2658c4e44b3b, built on 03/27/2018 03:55 GMT
Latency min/avg/max: 0/0/0
Received: 1
Sent: 0
Connections: 1
Outstanding: 0
Zxid: 0x0
Mode: standalone
Node count: 4
Connection closed by foreign host.

  这说明,单击的zookeeper已经安装成功而了。

最后为zookeeper配置环境变量

添加export ZOOKEEPER_HOME=/usr/local/zookeeper
在path中添加$ZOOKEEPER_HOME/bin
 然后使用source /etc/profile 立即刷新配置文件

2.Zookeeper集群的搭建

 先在结点下试验(这个先欠着),还欠缺一个zookeeper是什么的博客。

单节点 Kafka Broker 的安装

  Kafkade 最新版本可以从http://kafka.apache.org/downloads.html下载最新的版本。截止本试验日期为止,最新的稳定版是2.0.0。官网提供源码包下载和两个不同Scala版本编译好的Kafka,可以直接下载安装运行。

  本次试验下载编译好的版本:http://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.0.0/kafka_2.11-2.0.0.tgz

  使用wget命令,将这个安装包下载到/usr/local/kafka目录下

[root@CentOs64-7 kafka]# wget http://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.0.0/kafka_2.11-2.0.0.tgz
--2018-10-18 10:44:31--  http://mirrors.tuna.tsinghua.edu.cn/apache/kafka/2.0.0/kafka_2.11-2.0.0.tgz
Resolving mirrors.tuna.tsinghua.edu.cn (mirrors.tuna.tsinghua.edu.cn)... 101.6.8.193, 2402:f000:1:408:8100::1
Connecting to mirrors.tuna.tsinghua.edu.cn (mirrors.tuna.tsinghua.edu.cn)|101.6.8.193|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 55751827 (53M) [application/octet-stream]
Saving to: ‘kafka_2.11-2.0.0.tgz’

100%[=====================================================================================================================================================>] 55,751,827  13.5MB/s   in 3.6s   

2018-10-18 10:44:35 (14.8 MB/s) - ‘kafka_2.11-2.0.0.tgz’ saved [55751827/55751827]

  解压(其实就是安装了)

tar -zxf kafka_2.11-2.0.0.tgz

Kafka目录介绍

  • /bin 操作kafka的可执行脚本,还包含windows下脚本

  • /config 配置文件所在目录

  • /libs 依赖库目录

  • /logs 日志数据目录,目录kafka把server端日志分为5种类型,分为:server,request,state,log-cleaner,controller

创建保存kafka日志的目录

mkdir /tmp/kafka-logs

启动kafka

/usr/local/kafka/kafka_2.11-2.0.0/bin/kafka-server-start.sh -daemon /usr/local/kafka/kafka_2.11-2.0.0/config/server.properties

检查9092端口和2181端口,9092是kafka的默认端口,2181是zookeeper的默认端口

[root@CentOs64-7 site-docs]# netstat -tunlp|egrep "(2181|9092)"
tcp 0 0 0.0.0.0:9092 0.0.0.0:* LISTEN 28688/java
tcp 0 0 0.0.0.0:2181 0.0.0.0:* LISTEN 27193/java

  如上,说明kafka已经启动。

接下来,验证这个kafka是否安装正确

1.创建并验证主题

[root@CentOs64-7 site-docs]# /usr/local/kafka/kafka_2.11-2.0.0/bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test
Created topic "test".   //说明主题创建成功

2.查看你创建的主题的详细信息,如果不指定主题(添加--topic参数),那么查看所有的主题信息

[root@CentOs64-7 site-docs]# /usr/local/kafka/kafka_2.11-2.0.0/bin/kafka-topics.sh --zookeeper localhost:2181 --describe --topic test
Topic:test    PartitionCount:1    ReplicationFactor:1    Configs:
    Topic: test    Partition: 0    Leader: 0    Replicas: 0    Isr: 0

3.向测试主题上发布消息

[root@CentOs64-7 site-docs]# /usr/local/kafka/kafka_2.11-2.0.0/bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test
>Test Mese ^H
>Test Message 1^H^[[3~
>q

  输入后按Ctrl+D退出输入。

4.从测试主题上读取消息

/usr/local/kafka/kafka_2.11-2.0.0/bin/kafka-console-consumer.sh --zookeeper localhost:2181 --topic test -- from-beginning
//上面这个命令用于kafka0.9以及0.9以下版本使用这个命令

/usr/local/kafka/kafka_2.11-2.0.0/bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test --from-beginning
//上面命令用于kafka0.9用这个命令

  输入Ctrl+C退出消费。

5.查看topic列表

/usr/local/kafka/kafka_2.11-2.0.0/bin/kafka-topics.sh --list --zookeeper localhost:2181

6.删除topic

kafka-topics.sh --delete --zookeeper node1:2181 --topic my-kafka-topic

producer,指定的Socket(192.168.1.181+9092),说明生产者的消息要发往kafka,也即是broker

consumer, 指定的Socket(192.168.1.181+2181),说明消费者的消息来自zookeeper(协调转发)

 kafka的编译

本小节参考:https://blog.csdn.net/caoshangpa/article/details/79743830

会编译,有备无患。下载源码kafka-1.1.0-src.tgz

解压,这里也解压到/home目录下

> tar -xzf kafka-1.1.0-src.tgz
> cd kafka-1.1.0-src

查看里面的README.md文档,编译依赖1.Gradle 3.0或更高版本;2.Java 7。jdk前面已经安装过了,现在安装Gradle。

Gradle下载https://gradle.org/install/,该页面指出Gradle依赖Java 7或更高版本。最新的Gradle版本是4.6,下载其编译好的二进制包gradle-4.6-bin.zip。

解压,这里也解压到/home目录下

$ unzip -d gradle-4.6-bin.zip
$ ls radle-4.6
LICENSE NOTICE bin getting-started.html init.d lib media

将bin添加到环境变量,编辑/etc/profile文件,在其末尾添加

export PATH=$PATH:/home/zhangcan/gradle-4.6/bin

使修改的profile立即生效

$ source /etc/profile

测试一下

$ gradle -v

CD到kafka源码目录,开始编译

1.输入gradle指令,开始下载环境

$ gradle

下载了一堆东西,如果提示有文件下载失败,多执行几次该指令即可

2.编译

$ ./gradlew releaseTarGz -x signArchives

还是下载了一堆东西,如果提示有文件下载失败,多执行几次该指令即可。编译成功后会提示。

此时,会在kafka-1.1.0-src/core/build/distributions目录下生成一个名为kafka_2.11-1.1.0.tgz的二进制包,这个包和从官网下载的二进制包是一样的

参考链接:http://kafka.apache.org/quickstart

原文地址:https://www.cnblogs.com/ToBeExpert/p/9789486.html