Hive入门学习--HIve简介

　　现在想要应聘大数据分析或者数据挖掘岗位，很多都需要会使用Hive,Mapreduce,Hadoop等这些大数据分析技术。为了充实自己就先从简单的Hive开始吧。接下来的几篇文章是记录我如何入门学习Hive的。

一、Hive简介

　　Hive是一个数据仓库基础工具，架构在Hadoop之上，能够处理Hadoop中的结构化数据。简言之，Hive和SQL是一个数据分析和处理工具，它提供了SQL查询功能，可以将SQL语句转换为Mapreduce任务运行。

　　既然Hive是架构在Hadoop之上的，我们就有必要简单的了解一下什么是Hadoop。Hadoop的出现是因为处理大数据的需要。因为现在的数据量过大，传统的数据库管理系统已经满足不了需求，所以我们需要一个有别于传统数据库的管理工具。Hadoop主要有两个模块Mapreduce和HDFS。Hadoop要稳定工作需要有很多模块的协助，Hive只是其中的一个模块。它还有其他模块比如:sqoop(用来管理HDFS和RDBMS之间的数据交互)，Pig(处理脚本语言)。运行Mapreduce作业的方法有很多：（1）使用java Mapreduce->不管是结构化，半结构化，非结构化的数据都可以处理 (2)使用像Pig的脚本语言->处理结构和半结构化数据（3）用Hive这样查询语言->结构化数据

　　Hive是由Facebook率先开发的，而后由Apache软件基金继续开发。它的使用范围很广，具有很大的商业用途，很多公司都用它，比如亚马逊。

二、Hive的特点

　　1.架构在一个数据库中并将处理后的数据放到HDFS中

　　2.Hive针对的是OLAP（联机分析处理）数据

　　3.提供了SQL类型语言查询HiveQL

三、Hive架构