大数据入门学习(一):初识大数据

大数据的定义

  大数据(Big Data)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。

大数据的特点

  ♦ 数据体量巨大:单一数据集的大小从数太字节(TB)至数十兆亿字节(PB)不等。

  ♦ 数据类型多样:数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。

  ♦ 处理速度快:数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。

  ♦ 价值密度低:单位数据的价值比较低,当海量的数据汇聚到一起时才能产出重要的数据。

注:“1秒定律”或者秒级定律,就是说对处理速度有要求,一般要在秒级时间范围内给出分析结果,时间太长就失去价值了.这个速度要求是大数据处理技术和传统的数据挖掘技术最大的区别.
原文地址:https://www.cnblogs.com/weilan/p/9262472.html