了解大数据的特点、来源与数据呈现方式

作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639

1.浏览2019春节各种大数据分析报告,例如:

这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993

春节人口迁徙大数据报告!http://www.sohu.com/a/293854116_679156

春节大数据:消费首破万亿 最佳伴手礼竟是教辅书?

http://news.163.com/19/0211/19/E7OPDBBU0001899N.html

大数据中的春节http://www.xinhuanet.com/politics/2019-02/13/c_1124110671.htm

春节年味大数据都有啥 90后年味就是抢红包http://news.zol.com.cn/708/7087625.html

春节大数据出炉

http://www.sohu.com/a/223982938_100012490

2019年微信春节大数据:收发红包人数超8亿

http://www.hnbstx.com/zixun/caijingzawen/20190212/124158.html

2.上述数据所采用数据的来源什么?

(1)导航数据

   用户在使用百度或者腾讯地图这类工具时候,收集用户的运动数据。

(2)引擎搜索

   在百度、谷歌等著名搜索引擎中统计用户搜索的信息

(3)交易数据

  用户在使用例如支付宝、微信支付时,腾讯或阿里收集到的交易数据。

3.大数据的呈现方式有哪些?

(1)文字阐述

(2)柱状或曲线形式展现

(3)热力图

(4)3D模型形式

4.大数据的特点是什么?对思维方式有何影响?

特点:

1、海量性

例如,IDC 最近的报告预测称,到2020 年,全球数据量将扩大50倍。目前,大数据的规模尚是一个不断变化的指标,单一数据集的规模范围从几十TB到数PB不等。简而言之,存储1 PB数据将需要两万台配备50GB硬盘的个人电脑。此外,各种意想不到的来源都能产生数据。

2、多样性

数据多样性的增加主要是由于新型多结构数据,以及包括网络日志、社交媒体、互联网搜索、手机通话记录及传感器网络等数据类型造成。

3、高速性

高速描述的是数据被创建和移动的速度。在高速网络时代,通过基于实现软件性能优化的高速电脑处理器和服务器,创建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、分析并返回给用户,以满足他们的实时需求。

4、易变性

大数据具有多层结构,这意味着大数据会呈现出多变的形式和类型。相较传统的业务数据,大数据存在不规则和模糊不清的特性,造成很难甚至无法使用传统的应用软件进行分析。传统业务数据随时间演变已拥有标准的格式,能够被标准的商务智能软件识别。目前,企业面临的挑战是处理并从各种形式呈现的复杂数据中挖掘价值。

对思维的影响:

第一,人们处理的数据从样本数据变成全部数据;第二,由于是全样本数据,人们不得不接受数据的混杂性,而放弃对精确性的追求;第三,人类通过对大数据的处理,放弃对因果关系的渴求,转而关注相关关系。事实上,大数据时代带给人们的思维方式的深刻转变远不止上述三个方面。

5.准备python编程环境

下载安装

https://www.python.org/

https://www.jetbrains.com/pycharm/download/#section=windows 

基础学习

廖雪峰https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000  

菜鸟教程http://www.runoob.com/python3/python3-tutorial.html 

6.简单的输入输出编程练习

设计完成一个Mad Libs游戏:

1).创造一个让人欢乐的有趣的故事;

2).提示伙伴输入相应类别的词;

3).将故事完整地输出。

  代码:

复制代码
language1=input('请输入一种编程语言:')
language2=input('请输入另一种编程语言:')
print(" 对于一个优秀的工程师来说,单单了解一种编程语言是远不足够的。 所以我们不单要学习一下{},还要学习一下{}".format(language1,language2))
复制代码

  运行结果:

 
 
 
 
原文地址:https://www.cnblogs.com/binguo666/p/10457898.html