目前可选的开源日志收集项目

facebook的scribe。

apache的chukwa。

linkedin的kafka。

cloudera的flume.

scribe主页:https://github.com/facebook/scribe

chukwa主页:http://incubator.apache.org/chukwa/

kafka主页:http://sna-projects.com/kafka/

                         scribe                              chukwa                              kafka                  flume

公司                    facebook                         apache/yahoo                   LinkedIn               Cloudera

开源时间              2008年10月                     2009年11月                    2010年12月            2009年7月

实现语言              c/c++                             JAVA                                 SCALA                 JAVA

框架                    push/push                       push/push                      push/pull                push/push

容错性             collector和store之间               Agent定期记录                 Agent可以通过          Agent和collector

                      有容错机制,而agent和           已送给collector的              collector自动识别      ,collector和store

                      collector之间的容错需用          数据偏移量,一旦              机制获取可用collector。 之间均有容错机制

        户自己是实现。                     出现故障,可根据              storm自己保存已经       ,且提供了三种级

                                                               偏移量继续发送数据。        获取数据的偏移量,一旦  别的可靠性保证。

                                                                                                   collector出现故障,可以

                                                                                                   根据偏移量继续获取数据。

负载均衡              无                                        无                                使用zookeeper             使用zookeeper

可扩展性              好                                        好                                   好                             好

agent             Thrift client,需                      自带一些agent,如获         用户需根据kafka提供          提供了各种非

                     自己实现。                               取hadoop logs的agent。   的low-level和high-level     长丰富的

                                                                                                       API自己实现。                 agent。

collector         实际上是一个thrift                     --                                   使用了sendfile,              系统提供了

                    server。                                                                        zero-copy等技术提高性能。 很多,可直接

                                                                                                                                             使用。

store              直接支持HDFS                         直接支持HDFS                    直接支持HDFS             直接支持HDFS

总体评价         易于使用,容错和                       属于hadoop系列                 设计架构(push/pull)    非常优秀。

                    负载均衡方面不够好,                  产品,直接支持                   非常巧妙,适合异构集群

                    且资料较少。                             Hadoop,目前                    ,但产品较新,且稳定性

                                                                  版本升级比较快,                有待验证。

                                                                  但还有待完善。

flume缺点:一种分流方式失败导致日志重复发送。日志的分流配置以及归档配置使用外部管理的方式,从而使系统的运维更方便。

摘自:http://backend.blog.163.com/blog/static/2022941262012525104047160/

原文地址:https://www.cnblogs.com/man-li/p/4359974.html