Kafka Connect能干什么

1、提升获取数据速度：当需要接受大数据，可以在几毫秒之内就拿到这些数据并开始进行处理。

2、提供高可用的数据传输：数据管道传输数据到业务系统的过程中，其间不会出现单点故障。即便出现故障也可以自动从故障中恢复，保证数据的可靠性。

3、提供高吞吐量管道、有效应对数据峰值：数据管道可以支持非常高的吞量，而且数据管道可以应对突发的吞吐量增长。

4、规范接口：对开发者提供了统一的实现接口，开发、部署和管理都非常方便。

5、提供高扩展性：使用分布式模式进行水平扩展。

6、提供RestAPI管理Connectors：在分布式模式下可以通过Rest Api提交和管理Connectors。

注：目前Kafka Connect已经支持绝大部分的主流数据源，如JDBC、HDFS、HBase等。

Kafka Connect使用示例

使用Kafka Connect之前先来了解些基本的概念：

——————————————————————————————————————————————————————

1、单机模式

./connect-standalone.sh ../config/connect-file.properties ../config/connect-file-source.properties ../config/connect-file-sink.properties

2、分布式

./connect-distributed.sh ../config/connect-distributed.properties