[SQL] SQL 基础知识梳理(三)

SQL 基础知识梳理(三) - 聚合和排序

【博主】反骨仔    【原文】http://www.cnblogs.com/liqingwen/p/5926689.html

  这是《SQL 基础知识梳理(二) - 查询基础》的下篇。

目录

一、对表进行聚合查询 

  1.聚合函数

    (1)5 个常用函数

      ①COUNT:计算表中的记录(行)数。

      ②SUM:计算表中数值列的数据合计值。

      ③AVG:计算表中数值列的数据平均值。

      ④MAX:求出表中任意列中数据的最大值。

      ⑤MIN:求出表中任意列中数据的最小值。

    (2)聚合:将多行汇总成一行。

图1-1 Shohin 表

  2.计算表中数据的行数 

--示例
SELECT COUNT(*)  -- *:参数,这里代表全部列
FROM dbo.Shohin;

  3.计算 NULL 以外数据的行数

  将 COUNT(*) 的参数改成指定对象的列,就可以得到该列的非 NULL 行数

SELECT COUNT(shiire_tanka)
FROM dbo.Shohin;

只计算非 NULL 的行

  【备注】除了 COUNT 函数,其它函数不能将星号作为参数

  【备注】COUNT 函数的结果根据参数的不同而不同。COUNT(*) 会得到包含 NULL 的数据行数,而 COUNT(<列名>) 会得到 NULL 之外的数据行数。

  4.计算合计值

SELECT SUM(hanbai_tanka) AS sum_hanbai_tanka,    --总和
    AVG(hanbai_tanka) AS avg_hanbai_tanka,        --平均
    MAX(hanbai_tanka) AS max_hanbai_tanka,        --最大
    MIN(hanbai_tanka) AS min_hanbai_tanka        --最小
FROM dbo.Shohin;

  【备注】所有的聚合函数,如果以列名为参数,会无视 NULL 值所在的行。

SELECT MAX(torokubi),  --torokubi 为日期
    MIN(torokubi)
FROM dbo.Shohin

  【备注】MAX/MIN 函数几乎适用于所有数据类型的列。SUM/AVG 函数只适用于数值类型的列。

  5.使用聚合函数删除重复值(关键字 DISTINCT)

--示例1:计算去除重复数据后的数据行数
SELECT COUNT(DISTINCT shohin_bunrui)
FROM dbo.Shohin;

--示例2:先计算数据行数再删除重复数据的结果
SELECT DISTINCT COUNT(shohin_bunrui)
FROM dbo.Shohin;

  【备注】在聚合函数的参数中使用 DISTINCT(示例1),可以删除重复数据。DISTINCT 不仅限于 COUNT 函数,所有的聚合函数都可以使用。

二、对表进行分组

  1.GROUP BY 子句

--语法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--GROUP BY <列名1>, <列名2>, ...;
--示例
SELECT shohin_bunrui AS '商品种类',
    COUNT(*) AS '数量'
FROM dbo.Shohin
GROUP BY shohin_bunrui;

  【备注】GROUP BY 子句中指定的列称为“聚合键”或“分组列”。

  【子句的书写顺序(暂定)】SELECT --> FROM --> WHERE --> GROUP BY

  2.聚合键中包含 NULL 的情况

SELECT shiire_tanka, COUNT(*)
FROM dbo.Shohin
GROUP BY shiire_tanka;

  【备注】聚合键中包含 NULL 时,在结果中也会以 NULL 行的形式表现出来。

  3.WHERE 对 GROUP BY 执行结果的影响

--语法
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--WHERE <表达式>
--GROUP BY <列名1>, <列名2>, ...
SELECT shiire_tanka, COUNT(*)
FROM dbo.Shohin
WHERE shohin_bunrui = '衣服'
GROUP BY shiire_tanka

  这里是先根据 WHERE 子句指定的条件进行过滤,然后再进行聚合处理。

  【执行顺序】FROM --> WHERE --> GROUP BY --> SELECT。这里是执行顺序,跟之前的书写顺序是不一样的。

  4.与聚合函数和 GROUP BY 子句有关的常见错误

  (1)易错:在 SELECT 子句中书写了多余的列

    SELECT 子句只能存在以下三种元素:

      ①常数

      ②聚合函数

      ③GROUP BY 子句中指定的列名(即聚合键)

易错点1

  【总结】使用 GROUP BY 子句时,SELECT 子句不能出现聚合键之外的列名。

  (2)易错:在 GROUP BY 子句中写了列的别名   

易错点2

  回顾之前说的执行顺序,SELECT 子句是在 GROUP BY 子句之后执行。所以执行到 GROUP BY 子句时无法识别别名。

  【总结】GROUP BY 子句不能使用 SELECT 子句中定义的别名。

  (3)易错:GROUP BY 子句的结果能排序吗?

  【解答】它是随机的。如果想排序,请使用 ORDER BY 子句。

  【总结】GROUP BY 子句结果的显示是无序的。

  (4)易错:在 WHERE 子句中使用聚合函数

易错点3

  【总结】只有 SELECT 子句和 HAVING 子句(以及 ORDER BY 子句)中能够使用聚合函数。

  

三、为聚合结果指定条件

  1.HAVING 子句

  WHERE 子句智能指定记录(行)的条件,而不能用来指定组的条件。

  【备注】HAVING 是 HAVE(拥有)的现在分词。

--语法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--GROUP BY <列名1>, <列名2>, ...
--HAVING <分组结果对应的条件>

  【书写顺序】SELECT --> FROM --> WHERE --> GROUP BY --> HAVING

SELECT shohin_bunrui, COUNT(*)
FROM dbo.Shohin
GROUP BY shohin_bunrui
HAVING COUNT(*) = 2

从通过商品种类进行聚合分组后的结果中,取出“包含数据的行数为 2 行”的数据

  2.HAVING 子句的构成要素

    (1)3 要素:

      ①常数

      ②聚合函数

      ③GROUP BY 子句中指定的列名(即聚合键)

易错用法

  3.HAVING 与 WHERE

  有些条件可以写在 HAVING 子句中,又可以写在 WHERE 子句中。这些条件就是聚合键所对应的条件

  

结果一样

  【建议】虽然结果一样,聚合键对应的条件应该写在 WHERE 子句中,不是 HAVING 子句中。

  【理由】①WHERE 子句的执行速度比 HAVING 快。

      ②意义:WHERE 子句 = 指定行所对应的条件,HAVING 子句 = 指定组所对应的条件。

 

四、对查询结果进行排序

  1.ORDER BY 子句

--语法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--ORDER BY <排序基准列1>, <排序基准列2>, ...
SELECT shohin_id, hanbai_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka;    --升序排列

销售单价由低到高(升序)

  排序键:ORDER BY 子句中书写的列名。

  【书写顺序】SELECT --> FROM --> WHERE --> GROUP BY --> HAVING --> ORDER BY

   2.升序(ASC)和降序(DESC):

SELECT shohin_id, hanbai_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka DESC;    --降序排列

  【备注】ORDER BY 子句中排列顺序时会默认使用升序(ASC)进行排列。

  3.指定多个排序键

SELECT shohin_id, shohin_mei, hanbai_tanka, shiire_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka, shohin_id;

  4.NULL 值的顺序:排序键中包含 NULL 时,会在开头或末尾进行汇总。

  5.在排序键中使用 SELECT 子句中的别名

SELECT shohin_id AS id, shohin_mei, hanbai_tanka AS ht
FROM dbo.Shohin
ORDER BY ht, id;

  【执行顺序】FROM --> WHERE --> GROUP BY --> HAVING --> SELECT --> ORDER BY

  【备注】ORDER BY 子句可以使用 SELECT 子句中定义的别名,GROUP BY 子句不能使用别名。

 

  6.ORDER BY 子句中使用聚合函数

SELECT shohin_bunrui, COUNT(*)
FROM dbo.Shohin
GROUP BY shohin_bunrui
ORDER BY COUNT(*);

  7.不建议使用列的编号进行排序,虽然可以

SELECT shohin_id ,
       shohin_mei ,
       shohin_bunrui ,
       hanbai_tanka ,
       shiire_tanka ,
       torokubi
FROM dbo.Shohin
ORDER BY hanbai_tanka DESC, shohin_id;

SELECT shohin_id ,
       shohin_mei ,
       shohin_bunrui ,
       hanbai_tanka ,
       shiire_tanka ,
       torokubi
FROM dbo.Shohin
ORDER BY 4 DESC, 1;  --这里使用列的编号,由于阅读不便,不推荐使用

结果是一样的

  【备注】在 ORDER BY 子句中不要使用列的编号。

传送门

  《SQL 基础知识梳理(一) - 数据库与 SQL

  《SQL 基础知识梳理(二) - 查询基础

备注

  这里采用 MS SQL Server 进行验证,不保证所有的 DBMS 执行结果正确。



【参考】《SQL ゼロからはじめるデータベース操作》

原文地址:https://www.cnblogs.com/liqingwen/p/5926689.html