hive分组排序函数 分组取top10

hive分组排序函数 分组取top10

语法:row_number() over( partition by 字段a order by 计算项b desc) rank

--这里rank是别名

Partition by:类似hive的建表,分区的意思

这里按字段a分区,对计算项b进行降序排序

实例:

要取top10品牌,各品牌的top10渠道,各品牌的top10渠道中各渠道的top10档期

1) 取top10品牌

Select 品牌,count/sum/其他() as num from tb_name order by num limit 10;

2) 取top10品牌下各品牌的top10渠道

Select a.* from(

Select 品牌,渠道,count/sum/其他() as num, row_number() over(partition by 品牌,order by num desc) rank

From tb_name

Where 品牌限制条件

Group by 品牌,渠道

)a

Where a.rank<=10;

3) 取top10品牌下各品牌的top10渠道中各渠道的top10档期

Select a.* from(

Select 品牌,渠道,档期,count/sum/其他() as num, row_number() over(partition by 品牌,渠道,order by num desc) rank

From tb_name

Where 品牌,渠道 限制条件

Group by 品牌,渠道,档期

)a

Where a.rank<=10;

原文地址:https://www.cnblogs.com/llphhl/p/7388016.html