目前可选的开源日志收集项目

facebook的scribe。

apache的chukwa。

linkedin的kafka。

cloudera的flume.

scribe主页：https://github.com/facebook/scribe

chukwa主页：http://incubator.apache.org/chukwa/

kafka主页：http://sna-projects.com/kafka/

scribe chukwa kafka flume

公司 facebook apache/yahoo LinkedIn Cloudera

开源时间 2008年10月 2009年11月 2010年12月 2009年7月

实现语言 c/c++ JAVA SCALA JAVA

框架 push/push push/push push/pull push/push

容错性 collector和store之间 Agent定期记录 Agent可以通过 Agent和collector

有容错机制，而agent和已送给collector的 collector自动识别，collector和store

collector之间的容错需用数据偏移量，一旦机制获取可用collector。之间均有容错机制

　　　　　　　　户自己是实现。出现故障，可根据 storm自己保存已经，且提供了三种级

偏移量继续发送数据。获取数据的偏移量，一旦别的可靠性保证。

collector出现故障，可以

根据偏移量继续获取数据。

负载均衡无无使用zookeeper 使用zookeeper

可扩展性好好好好

agent Thrift client，需自带一些agent，如获用户需根据kafka提供提供了各种非

自己实现。取hadoop logs的agent。的low-level和high-level 长丰富的

API自己实现。 agent。

collector 实际上是一个thrift -- 使用了sendfile，系统提供了

server。 zero-copy等技术提高性能。很多,可直接

使用。

store 直接支持HDFS 直接支持HDFS 直接支持HDFS 直接支持HDFS

总体评价易于使用，容错和属于hadoop系列设计架构（push/pull）非常优秀。

负载均衡方面不够好，产品，直接支持非常巧妙，适合异构集群

且资料较少。 Hadoop，目前，但产品较新，且稳定性

版本升级比较快，有待验证。

但还有待完善。

flume缺点：一种分流方式失败导致日志重复发送。日志的分流配置以及归档配置使用外部管理的方式，从而使系统的运维更方便。

摘自：http://backend.blog.163.com/blog/static/2022941262012525104047160/