kafka听课笔记（随更）

kafka

消息队列
解耦、异步、流量削峰（服务器高峰期不直连）
把可有可无的消息处理放在消息队列，先异步响应，再调用消息处理

解耦

允许独立修改扩展处理过程，遵循接口约束。
可恢复性

系统部分组件失效，消息队列降低耦合，允许在挂掉某个处理进程，在系统恢复以后继续进行。
缓冲

控制优化数据流经过系统速度，解决生产消息和消费信息处理速度不一致情况。
灵活，峰值处理

突发流量处理，访问量剧增，不需要投入资源，关键组件负责顶住并发量，防止超负荷。
异步

信息优先级较低，不立刻处理，进入消息队列等待。

消息队列模式
点对点模式

一对一，消费者主动pull数据，消息收到立即清除

发布/订阅模式（kafka）

一对多，消费者消费完不清除消息

消息发布到topic中，同时多个消费者消费（订阅）该消息，发布到topic的消息被所有订阅者消费。

分类：

消费者主动拉取
- 缺点：长轮询，多次访问队列，资源浪费。
消息队列推送

kafka基本架构

发布/订阅模式（消费者主动拉取）
- 生产者生产消息
  - producer 提交消息进入集群。
  - 通过topic主题分类进入不同的Broker，消息交给leader（kafka进程服务器）。
- kafka集群管理消息
  - Broker 有一个leader，很多follower（备份，随时准备上位篡权leader）。
  - 分区Partition提高并发，横向扩展，提高负载能力。
- 消费者消费消息
  - 同一个分区的数据只能被同一个消费者组的某一个消费者所消费。
  - 一个分区的一个数据只能被消费者组的一个用户消费，同组用户不能使用同一分区数据。
  - 当消费者个数>集群分部数，就会造成消费者资源浪费，当相等时，资源利用率最高
- zookeeper 注册消息
  - 帮助kafka管理集群，存储信息，帮消费者存储位置信息，高版本存放到系统topic中。
  - 使用同一套zookeeper集群，kafka就可以保证同一套集群。
  - zookeeper缺点：影响效率，消费者拉取要经过zookeeper。
kafka数据存放在磁盘中，而不是内存

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/husiyu/p/15049102.html