【Hive】解析json(get_json_object)

 要确保被解析的字段是string类型才可以使用json解析.解析map类型不能使用json解析,解析map类型可以使用col_name['key']获取对应key的value.

get_json_object(string json_string, string path)

说明:
第一个参数填写json对象变量,第二个参数使用$表示json变量标识,然后用 . 或 [] 读取对象或数组;如果输入的json字符串无效,那么返回NULL。
每次只能返回一个数据项。

举例:
data 为 test表中的字段,数据结构如下:

data =
{
"store":
{
"fruit":[{"weight":8,"type":"apple"}, {"weight":9,"type":"pear"}],
"bicycle":{"price":19.95,"color":"red"}
},
"email":"amy@only_for_json_udf_test.net",
"owner":"amy"
}
1
2
3
4
5
6
7
8
9
10
1.get单层值

hive> select get_json_object(data, '$.owner') from test;
结果:amy
1
2
2.get多层值.

hive> select get_json_object(data, '$.store.bicycle.price') from test;
结果:19.95
1
2
3.get数组值[]

hive> select get_json_object(data, '$.store.fruit[0]') from test;
结果:{"weight":8,"type":"apple"}

原文地址:https://www.cnblogs.com/guweiwei/p/14981973.html