050 Kafka的引入介绍

  高吞吐量的分布式订阅消息系统

1.官网

  http://kafka.apache.org/

  

2.官网的介绍

  

3.结构

  这个是版本1.0之后的版本。

  

  In Kafka the communication between the clients and the servers is done with a simple, high-performance, language agnostic TCP protocol.

  This protocol is versioned and maintains backwards compatibility with older version.

  We provide a Java client for Kafka, but clients are available in many languages.

 4.具体的结构

  备份属于来源于leader的分区上。

  

5.术语

  重点是Partition。

  需要记住的是consumer Group。

  

6.1.0之后的新特性

  这个在上面的图上可以显示出来,官网上的图。

  

  为啥功能这么强大,还要用spark干嘛?

  理由是,spark可以转换方便,可以使用SQL。

  

原文地址:https://www.cnblogs.com/juncaoit/p/9409994.html