hadoop之hive集合数据类型

除了string,boolean,date等基本数据类型之外,hive还支持三种高级数据类型:

1.ARRAY

ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;


2.MAP

MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist['username']来得到这个用户对应的password;

3.STRUCT

STRUCT可以包含不同数据类型的元素。类似于一个对象,这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。

--我们创建一张基于基本数据类型和集合数据类型的表
CREATE TABLE employees (  
    name STRING,  
    salary FLOAT,  
    subordinates ARRAY<STRING>,  
    deductions MAP<STRING, FLOAT>,  
    address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>  
) PARTITIONED BY (country STRING, state STRING);
ROW FORMAT DELIMITED
FIELDS TEMINATED BY '01'
COLLECTION ITEMS TERMINATED BY '02'
MAP KEYS TEMINATED BY '03'
LINES TERMINATED BY '
'
SORTED BY TEXTFILE;
--如果想要查询里面的数据,可以用下面的SQL

select name,salary,subordinates[0],deductions['key'],address.city from employees;
原文地址:https://www.cnblogs.com/wangbin2188/p/8252513.html