Week08_day01 (Hive 自定义函数 UDF 一个输入,一个输出(最常用))

当我们进入企业就会发现,很多时候,企业的数据都是加密的,我们拿到的数据没办法使用Hive自带的函数去解决,我们就需要自己去定义函数去查看,哈哈,然而企业一般不会将解密的代码给你的,只需要会用,但是我们也需要知道怎么去实现。

1、打开编译器,我使用的myEclipse,  在maven项目中添加依赖

    <!-- Hive_UDF -->
        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-exec</artifactId>
            <version>1.2.1</version>
        </dependency>

等待下载完成。

2、新建类 需要继承 UDF 父类 (注意,这里不会提示我们需要重写的方法,因为源码是以注释的方式进行引用的,所以我们需要手动敲,哈哈这就比较那个啥了)

这里我实现了一个将大写字母转小写的简单例子:

public class UDF_test extends UDF{
    public String evaluate(String s){
        String s1 = s.toLowerCase();
        return s1;
    }

}

3、导出jar包

4、将jar包拖至Linux中

5、将jar包加入到HIve资源库

add jar jar包的绝对路径;

6、创建自定义方法函数

CREATE TEMPORARY FUNCTION 为方法起个名字 as '包名+类名';

 

7、进行测试

原文地址:https://www.cnblogs.com/wyh-study/p/12088703.html