Mysql分组排序的三种方法以及substring_index

用惯了hive的row_number,在Mysql中想要使用分组排序的功能时,却发现不那么简单 —— 貌似不能一个函数解决。

有时候又特别需要使用,怎么办呢?不慌,这也还是有方法的。

首先建立数据表

create table t_variable
(
name_people VARCHAR(255) NOT NULL comment '姓名',
grade VARCHAR(255) NOT NULL comment '年级',
course VARCHAR(255) NOT NULL comment '科目',
score VARCHAR(255) NOT NULL comment '分数'
)ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='test_变量';

insert into t_variable(name_people, grade, course, score) values('花满楼',5,'数学',86);
insert into t_variable(name_people, grade, course, score) values('陆小凤',5,'数学',94);
insert into t_variable(name_people, grade, course, score) values('西门吹雪',5,'数学',90);
insert into t_variable(name_people, grade, course, score) values('花满楼',5,'语文',97);
insert into t_variable(name_people, grade, course, score) values('陆小凤',5,'语文',95);
insert into t_variable(name_people, grade, course, score) values('西门吹雪',5,'语文',89);
insert into t_variable(name_people, grade, course, score) values('花满楼',5,'科学',93);
insert into t_variable(name_people, grade, course, score) values('陆小凤',5,'科学',96);
insert into t_variable(name_people, grade, course, score) values('西门吹雪',5,'科学',94);

那么,分组排序

方法一:使用变量@ —— 还可以选择排名在第几的人。

select
    name_people,
    course,
    score,
    @ss,
    @tt,
    if(@ss=course, @tt:=@tt+1, @tt:=1) as rk,
    @ss:=course as a_course
from 
(
select
    * 
from 
    t_variable
order by 
    course,
    score desc    # 先按分组字段和排序字段进行整体排序,这样相同选择字段的记录就会前后排列
) as t1
cross join       #直接笛卡尔积
(
    select 
      @ss:='',  #初始值
      @tt:=0
) as t2;

方法二:group_concat —— 同一分组内的值先连接,再选取;#[Err] 1140 - In aggregated query without GROUP BY, expression #1,使用group_concat必须用group by

select     
  course,
  group_concat(score order by score desc) as sc   #连接的是排序字段
from 
    t_variable   
group by 
  course   #分组字段

可使用 substring_index 进行选择第几个:

select     
  course,
  substring_index(group_concat(score order by score desc),',',1) as sc
from 
    t_variable 
group by 
  course

当然,如果要知道是哪条记录在排名第一的位置,需要用这个结果与原始表join选择一下。

方法三:通过join查询实现

select 
    *
from 
(
    select 
        a.course,
        a.score,
        count(*) as sc
        from t_variable as a
        left join 
            t_variable as b
            on 
                a.course=b.course    #本来的分组字段
                and 
                a.score<=b.score     #本来的排序字段
        group by 
            course,                  #此时才对以上结果进行分组
            score
) as c
where 
    c.sc=1;

这个稍微复杂一点,是通过join之后,进行筛选,再对筛选结果分组计数得到,只需要看个中间表即可 —— 因为最大值小于等于的值只有它本身,也就是对小于等于的记录进行计数count时,值会为1,其他非最大值都会大于1:

select 
        a.course,
        a.score,
        count(*) as sc
        from t_variable as a
        left join 
            t_variable as b
            on 
                a.course=b.course
                and 
                a.score<=b.score
        group by 
            course,    
            score;

附:substring_index —— SUBSTRING_INDEX(str,delim,count),用于获取子字符串

-- str:待处理字符串
-- delim:分隔符
-- count:计数值

若count是正数,则从左往右数,第count个分隔符左边的字符串
若count是负数,则从右往左数,第count个分隔符右边的字符串

select substring_index('烽火台、长城、颐和园、北海','',1)
select substring_index('烽火台、长城、颐和园、北海','',3)

select substring_index('烽火台、长城、颐和园、北海','',-2)

select substring_index(substring_index('烽火台、长城、颐和园、北海','',2),'','-1')  #如果选中间的子字符串,可以嵌套

#

参考:

https://blog.csdn.net/m0_37797991/article/details/80511855

https://www.cnblogs.com/mqxs/p/7380933.html

原文地址:https://www.cnblogs.com/qi-yuan-008/p/12788213.html