Hive学习笔记:split函数分割字符串

语法

split(str string, regex string) -- 使用 regex 分割字符串 str

返回值为一个数组。

基本用法

select split('a,b,c,d', ',') from temp_cwh_test; -- 分割
-- 结果为数组
["a","b","c","d"]

截取字符串中某个值

select split('a,b,c,d', ',')[0] from temp_cwh_test; 
-- 提取第1个值
a

可以指定提取结果数组中的某个值。

特殊字符的处理

针对特殊分割符号,需要特殊处理。

select split('122.122.122.122', '.') from temp_cwh_test; 
-- 将出错,无法得到预想结果

正确语法为:

select split('122.122.122.122', '\.') from temp_cwh_test; 
-- 结果
["122","122","122","122"]

split 包含在双引号 " " 之中时,需要添加4个反斜杠。例如:

hive -e "... split('122.122.122.122', '\\.')"

否则得到的值为空值 NULL。

同样的 | 等特殊符号需做类似处理。

有些特殊字符转义只需要1个反斜杠,而有些需要2个反斜杠,需要注意测试一下。

参考链接1:hive函数 -- split 字符串分割函数

参考链接2:【Hive】split函数(分割字符串)

原文地址:https://www.cnblogs.com/hider/p/12656842.html