Apache Cassandra使用报告2020

Apache Cassandra是为至关重要的数据而生的NoSQL数据库。

最近,来自全球各地的901位从业人员参与了一项详尽全面的问卷调查。Apache Cassandra社区根据这份调查的结果,发布了关于Cassandra使用情况的结论报告。

这份年度报告提供了理解关于“谁、怎样以及为何使用Cassandra”这些问题的基准,其重要性不言而喻。


“据我了解,在全球范围内Apache Cassandra都做到了零宕机时间。这是一个强有力的对事实的陈述。对我们的业务来说,这相当重要。”

——一位来自伦敦的从业人员

01 重要结论

Cassandra的采用与在数字化转型阶段更高阶的企业关系更为密切

有些调查参与者自认为自己所在的企业处在“非常高阶”的数字化转型阶段,而另一些则认为自己所在的企业处在“高阶”或“正在进行中”的数字化转型阶段。前者相比后者更有可能已经在使用Cassandra(“非常高阶”:26%;“高阶”:10%;“正在进行中”:5%)。

可调性、安全性和可扩展性被从业人员选为选择Cassandra的核心原因

从业人员选择在至关重要的应用程序中使用Cassandra的主要原因是:“好的混合解决方案”(62%)、“非常安全”(60%)、“良好的扩展性”(57%)、“速度快”(57%)、“与应用程序协同构建的过程简单”(55%)。

缺乏熟练的员工以及数据迁移的挑战阻碍了Cassandra的采用

正在关键应用程序中使用Cassandra的从业人员中,有36%的人认为缺乏对Cassandra有经验的团队成员会阻碍Cassandra的采用。

当被问到什么因素会使从业人员在生产环境中更多地将Cassandra应用于应用程序和性能特点时,他们的回答是“更容易的迁移过程”和“更容易的集成过程”。

02 研究方法

本次调查的时间为2020年4月13日至4月23日,调查由1404个与IT从业人员(practitioner/professional)和高管(executive)的访谈构成,本使用报告更关注其中的901个从业人员。

这份调查问卷共有7种不同语言的版本,参与者来自于13个地区(中国、印度、日本、韩国、德国、英国、法国、荷兰、爱尔兰、巴西、墨西哥、阿根廷、美国)。

由于线上调查的样本(samples)和总体(population)的关系并不明确,所以抽样的误差范围无法科学地计算出来。但是通过等价的典型抽样(representative sampling),我们可以知道总体样本的误差范围为+/-2.6%,从业人员样本的误差范围为+/-3.3%,高管样本的误差范围为+/-4.4%。

为了保证参与者的质量,调查问卷中包含了对参与者的职位、公司规模(不含少于100个员工的公司)、云技术知识以及IT从业年限的增强型筛查。

由于四舍五入和多选题的存在,某些问题的结果数据的总和也许不为100。

03 调查参与者的特征

参与问卷的从业人员的职位类型涵盖了:Dev/DevOps(52%)、 Ops/架构师(29%)、数据科学家和工程师(11%)以及DBA(8%),他们来自美洲(43%)、欧洲(32%)和亚太地区(12%)。

调查参与者既有来自大型企业(65%来自1000+员工的公司)和中小企业(35%来自超过100名员工的中小企业)。参与者所在的行业包括了IT(45%)、金融服务(11%)、医疗(4%)、零售(3%)、政府(5%)、教育(4%)、通信(3%)以及其它(17%)。

04 Cassandra的采用

22%的从业人员现在正在使用或正评估使用Cassandra,另有11%的人计划在未来的12个月内开始使用Cassandra。

在正在使用Cassandra的人中,89%使用开源版Cassandra,包括了自行管理(72%)和第三方管理(48%)的版本。

现在正在使用Cassandra的从业人员非常有可能在未来的更多项目中继续使用Cassandra。总体看,15%的从业人员表明他们非常有可能在下一个项目中继续使用Cassandra(在10分满分的评价体系中给出了10分)。而在这些人中,71%的人正在使用或是之前已经使用过Cassandra。

05 Cassandra的使用

有些调查参与者自认为自己所在的企业处在“非常高阶”的数字化转型阶段,而另一些则认为自己所在的企业处在“高阶”或“正在进行中”的数字化转型阶段。前者相比后者更有可能已经在使用Cassandra——“非常高阶(highly advanced)”:26%;“高阶(advanced)”:10%;“正在进行中(in-process)”:5%。

Cassandra在非常重要或是成败关键的应用程序中占据统治地位。在所有被调查的从业人员中,31%的人将Cassandra用于成败关键的应用程序,55%的人将Cassandra用于非常重要的应用程序,38%的人将Cassandra用于比较重要的应用程序,而只有20%的人将Cassandra用于对他们来说并不重要的应用程序。

“我们计划发送上亿条信息,每天如此。两周我们就要发送超过20亿条信息。这就是我们使用Cassandra的原因。”

——一位来自阿姆斯特丹的从业人员

06 为什么选择Cassandra

从业人员选择在至关重要的应用程序中使用Cassandra的主要原因是:“好的混合解决方案”(62%)、“非常安全”(60%)、“良好的扩展性”(57%)、“速度快”(57%)、“与应用程序协同构建的过程简单”(55%)。

“多流量多数据的环境下,你可能在为你的数据寻找某种极为简单的键值持久化(key value persistence)方案。Cassandra将大大满足你的需求,我可以保证。”

——某全球高级工程副总裁

对于处在“非常高阶”的数字化转型阶段的公司来说,58%认为“不会丢失数据”是选择Cassandra的最重要因素,另外“给我信心”(56%)、“云原生”(56%)和“非常安全”(56%)等原因也获得了很多认同。

“不会丢失任何数据、得能捕捉到所有东西、不能有安全缺陷、得一定程度上与环境兼容、当决定采用新数据库时不能只是在复制旧有数据库的数据……答案就是:Cassandra。”

——一位来自旧金山的从业人员

然而,正在关键应用程序中使用Cassandra的从业人员中,有36%的人认为缺乏对Cassandra有经验的团队成员会阻碍Cassandra的采用。

“我们没时间去培训或调配大量的开发人员并使其快速进入状况,这真的是问题的关键。其它的事情,像是伸缩性,这些都好说。”

——一位来自伦敦的从业人员

当被问到什么因素会使从业人员在生产环境中更多地将Cassandra应用于应用程序和性能特点时,他们的回答是“更容易的迁移过程”和“更容易的集成过程”。

“如果我能在半小时内上手并开始产生效益,那这就是一件不太费脑的事情。”

——一位来自伦敦的从业人员

DataStax的Astra数据库即服务(DBaaS)平台的出现就是为了帮助企业克服运维的挑战。

Astra使Cassandra数据库的部署时间从数周缩短至数分钟并且无需人工操作,消除了安装、操作和扩展Cassandra的技术障碍,同时方便了云原生应用程序的开发和使用。

点击此处了解更多关于DataStax Astra的特性和使用案例,点击此处还可以了解如何利用官方示例程序库迅速上手Astra。

  

07 迈向Cassandra 4.0

我们邀请任何对Cassandra好奇的人来测试Cassandra 4.0 beta版本。点击这里了解更多Cassandra 4.0的详情。

未来的Beta版本或正式发布的版本都不会再有新的功能或重大的API变化,所以你可以放心,你在目前的beta版本上所花的时间会有助于将你的生产工作迁移到4.0版本。

Reference:

    https://cassandra.apache.org/blog/2020/07/20/apache-cassandra-4-0-beta1.html

原文地址:https://www.cnblogs.com/datastax/p/13911159.html