SQL语句之Group By

1. Group By 语句简介：

Group By语句从英文的字面意义上理解就是“根据(by)一定的规则进行分组(Group)”。它的作用是通过一定的规则将一个数据集划分成若干个小的区域，然后针对若干个小区域进行数据处理。

P.S. 这里真是体会到了一个好的命名的力量，Group By从字面是直接去理解是非常好理解的。恩，以后在命名的环节一定要加把劲:)。话题扯远了。

2.1 Group By [Expressions]:

这个恐怕是Group By语句最常见的用法了，Group By + [分组字段](可以有多个)。在执行了这个操作以后，数据集将根据分组字段的值将一个数据集划分成各个不同的小组。比如有如下数据集，其中水果名称(FruitName)和出产国家(ProductPlace)为联合主键：

FruitName	ProductPlace	Price
Apple	China	$1.1
Apple	Japan	$2.1
Apple	USA	$2.5
Orange	China	$0.8
Banana	China	$3.1
Peach	USA	$3.0

如果我们想知道每个国家有多少种水果，那么我们可以通过如下SQL语句来完成：

1 SELECT COUNT(*) AS 水果种类,ProductPlace AS 出产国
2 FROM T_TEST_FRUITINFO
3 GROUP BY ProductPlace

这个SQL语句就是使用了Group By + 分组字段的方式，那么这句SQL语句就可以解释成“我按照出产国家(ProductPlace)将数据集进行分组，然后分别按照各个组来统计各自的记录数量。”很好理解对吧。这里值得注意的是结果集中有两个返回字段，一个是ProductPlace(出产国), 一个是水果种类。如果我们这里水果种类不是用Count(*)，而是类似如下写法的话：

SELECT FruitName,ProductPlace FROM T_TEST_FRUITINFO
GROUP BY ProductPlace

那么SQL在执行此语句的时候会报如下的类似错误：

选择列表中的列'T_TEST_FRUITINFO.FruitName'无效，因为该列没有包含在聚合函数或GROUPBY子句中。

这就是我们需要注意的一点，如果在返回集字段中，这些字段要么就要包含在Group By语句的后面，作为分组的依据；要么就要被包含在聚合函数中。我们可以将Group By操作想象成如下的一个过程，首先系统根据SELECT 语句得到一个结果集，如最开始的那个水果、出产国家、单价的一个详细表。然后根据分组字段，将具有相同分组字段的记录归并成了一条记录。这个时候剩下的那些不存在于Group By语句后面作为分组依据的字段就有可能出现多个值，但是目前一种分组情况只有一条记录，一个数据格是无法放入多个数值的，所以这里就需要通过一定的处理将这些多值的列转化成单值，然后将其放在对应的数据格中，那么完成这个步骤的就是聚合函数。这就是为什么这些函数叫聚合函数(aggregate functions)了。

2.2 Group By All ：多了一个关键字ALL。这个关键字只有在使用了where语句的，且where条件筛选掉了一些组的情况才可以看出效果

SELECT COUNT(*) AS 水果种类,ProductPlace AS 出产国
FROM T_TEST_FRUITINFO
WHERE (ProductPlace<>'Japan')
GROUP BY ALL ProductPlace

2.3 GROUP BY [Expressions] WITH CUBE | ROLLUP：首先需要说明的是Group By All 语句是不能和CUBE 和 ROLLUP 关键字一起使用的。

SELECT C_EMPLINFO_DEPTID,C_EMPLINFO_SEX,COUNT(*) AS 
C_EMPLINFO_TOTALSTAFFNUM
FROM T_PERSONNEL_EMPLINFO
GROUP BY C_EMPLINFO_DEPTID,C_EMPLINFO_SEX WITH CUBE

SELECT C_EMPLINFO_DEPTID,C_EMPLINFO_SEX,COUNT(*) AS C_EMPLINFO_TOTALSTAFFNUM
FROM T_PERSONNEL_EMPLINFO
GROUP BY C_EMPLINFO_DEPTID,C_EMPLINFO_SEX WITH ROLLUP

SELECT COUNT(*) AS ProductCount,Discount,GROUPING(Discount) AS Expr1
FROM T_TEST_FRUITINFO
GROUP BY Discount WITH ROLLUP

2.2Group By 和 Having, Where ,Order by语句的执行顺序：

最后要说一下Group By, Having, Where, Order by几个语句的执行顺序。一个SQL语句往往会产生多个临时视图，那么这些关键字的执行顺序就非常重要了，因为你必须了解这个关键字是在对应视图形成前的字段进行操作还是对形成的临时视图进行操作，这个问题在使用了别名的视图尤其重要。以上列举的关键字是按照如下顺序进行执行的：Where, Group By, Having, Order by。首先where将最原始记录中不满足条件的记录删除(所以应该在where语句中尽量的将不符合条件的记录筛选掉，这样可以减少分组的次数)，然后通过Group By关键字后面指定的分组条件将筛选得到的视图进行分组，接着系统根据Having关键字后面指定的筛选条件，将分组视图后不满足条件的记录筛选掉，然后按照Order By语句对视图进行排序，这样最终的结果就产生了。在这四个关键字中，只有在Order By语句中才可以使用最终视图的列名。

转载：http://www.cnblogs.com/glaivelee/archive/2010/11/19/1881381.html