Pig数据类型

基本类型

int、long、float、double、chararray、bytearray、datatime、boolean、biginteger、bigdecimal

复杂类型

map、tuple、bag
NULL
 

map

['key1'#value1, 'key2'#value2]
key-value键值对,key是chararray类型,value可以是任意类型(基本类型、复杂类型都可以)。
 

tuple 元组

('lisg', 23)
tuple是一组有序的字段,类似于RDBMS的一行或者select c1, c2, c3 from xx中的(c1, c2, c3)
可以通过索引访问tuple里面的字段
data = load 'data' as (name:chararray, age:int, address:chararray),这里as后面的就是一个tuple
 

bag 袋

{('lisg', 'beijing'), ('dengsl', 'hunan')}
bag里面是一组tuple,这些tuple是无序的。
 
 
原文地址:https://www.cnblogs.com/lishouguang/p/4559259.html