pig中对元组不能直接使用聚集函数(如COUNT)

pig中想要使用统计等aggregate函数,必须先group,再进行。而如何设计group也就成了一个相对麻烦的过程,这给程序设计造成了不小的麻烦。

所以pig很强大,但其语法还是有些晦涩,存在很大进步空间。

pig和sql不同,在sql中,可以直接对当前表使用aggregate函数,如count,进行统计计算。

而在pig中,必须是先group后,实现了聚集后,再使用相关的aggregate函数。

这些说明在programming pig一书中有详细记载。

不怕hive一样的对手,就怕pig一样的队友。

小杰是hive,我就是个彻头彻尾的pig!哎,给小组丢人了!

原文地址:https://www.cnblogs.com/cl1024cl/p/6205753.html