Apache Pig 0.11.0 发布,大规模数据分析

Apache Pig 0.11.0 发布了,该版本包含大量 bug 修复和很多新特性,例如 DateType、RANK、CUBE 和 ROLLUP 操作符,支持 Groovy UDFs,可插入式 reducer 估计逻辑,附加 UDF 特性等等。

Apache Pig 0.11.0 要求 Hadoop 0.20.X, 1.X, 0.23.X and 2.X。

Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。

原文地址:https://www.cnblogs.com/shihao/p/2936166.html