读《大数据》的三重大思维转变,有感

    大数据这个词语,这几年炙手可热。大数据在某些领域已经显示出了它的价值了。比方航空公司产品销售策略分析,淘宝用户逛店铺的途径是PC还是手机。Google以前使用大数据就准确预測过流感病毒的传播和发源地。

    前不久国务院总理李克强就针对大数据约见了浪潮等一些厂商,可见大数据在我们国家已被提升到了如此高度的重视了。

我们不难预測在不久的将来大数据将广泛的应用到我们社会的各个方面。

    那么面对这样一个大数据时代,不能在固守原来的一亩三分地了,我们要敞开思想放下原来的固执去迎接大数据时代的到来。

    大数据与三个重大的思维转变有关,这三个转变是互相联系和互相作用的。

    首先,分析与某事物相关的全部数据,而不是依靠分析少量的数据样本。

    原来我们不具备手段或工具去分析全部的数据样本。而是採用抽样分析情况。这样的以管窥豹的时代会照成分析结果不准确。

我们如今拥有了大数据分析的手段和平台(hadoop 、ga 、spark 等)能够去分析某一事物的全部数据了。

曾经,每到过春节新闻中都会纷纷报道各个省市的人均GDP,人均收入水平,差点儿非常少人信这个数据是准确的。

为什么会出现民众对新闻报道的数据产生不信任呢?究其原因是数据不准确不实际。做数据调查的群体仅仅是抽样了经济发展不错的城镇做出的结论。

由于假设要获得相当精确的数据的代价是非常大的,要排多少调查人员,走訪多少村镇。耗费多长的时间,想一想就是一个庞大的project。可是在大数据时代,我们有了数据中心,我们就能够轻松高效全面的统计分析整个地区的结果,找出发达的地区和欠发达的地区,均衡整个地区的发展趋势。

    其次,要乐于接受数据的纷繁复杂。而不再最求数据的精确性。

    我们的工作生活会产生多少的数据呢?街道的摄像记录。小区的门禁监控记录,公司上下班的打卡记录,浏览网页的浏览历史。每个人每一天不知不觉都会产生很大的数据。

更何况以后建立的智慧城市,这个数据的数量级我们难以想象了。我们不得不面临纷繁复杂的数据,所以再去考虑某一条数据是不是精确的代价已经变得得不偿失了,没有必要再去最求数据要多么的精确了。

    最后。重点不再去探求难以琢磨的因果关系。转而关注事物的相关关系。

    最求事物的因果关系。我们从小就被这种教育。在大数据面前去分析数据的因果关系,这是钻入数据之中。是一件很困难的事情。由于不论什么一条数据的产生都可能是多种因素影响产生的,是不easy找到真正原因的。然而关注事物的相关关系,这是站在数据之上。关注数据之间的相关性,弄明确不同数据种类之间的关系型,通过这种数据类型之间的关系性就能够预測数据发展的未来。

拿出手机扫一扫以下的二维码,关注微信号。分享读后感:

原文地址:https://www.cnblogs.com/zfyouxi/p/5169294.html