三、函数（SUM、MIN、MAX、COUNT、AVG）

第八章使用数据处理函数

8.1 函数

SQL支持利用函数来处理数据。函数一般是在数据上执行的，给数据的转换和处理提供了方便。

每一个DBMS都有特定的函数。只有少数几个函数被所有主要的DBMS等同的支持。

8.2 使用函数

大多数SQL实现支持以下类型的函数：

　　用于处理文本串（如删除或填充值，转换值为大写或小写）的文本函数

　　用于在数值数据上进行算术操作（如返回绝对值，进行代数运算）的数值函数

　　用于处理日期和时间值并从这些值中提取特定成分（如,返回两个日期之差，检查日期有效性等）的日期和时间函数

　　返回DBMS正使用的特殊信息（如返回用户登录信息）的系统函数

　　8.2.1 文本处理函数

　　1.UPPER（）函数将文本转换为大写

　　SELECT member_name,UPPER(member_name) AS

　　member_name_upcase

　　FROM personal_appeal

　　ORDER BY member_name;

列出两列，第一列是表中存储的值，第二列 member_name_upcase 转换为大写

常用的文本函数：

SOUNDEX是一个将任何文本串转换为描述其语音表示的字母数字模式的算法。

SOUNDEX考虑了类似的发音字符和音节，使得能对串进行发音比较而不是字母比较，多数DBMS都提供了对SOUNDEX的支持。

使用SOUNDEX（）函数进行搜索: 匹配所有发音类似于LV的联系名

SELECT member_name FROM personal_appeal WHERE SOUNDEX(member_name)= SOUNDEX('LV');

WHERE 子句使用 SOUNDEX（）函数来转换 member_name 列值和搜索串为它们的 SOUNDEX 值。

8.2.2 日期和时间处理函数

日期和时间采用相应的数据类型存储在表中，每种DBMS都有自己的变体。日期和时间值以特殊的格式存储，以便能快速和有效地排序或过滤，并且节省物理存储空间。

一般，应用程序不使用用来存储日期和时间的格式，因此日期和时间函数总是被用来读取、统计和处理这些值。

日期和时间函数在SQL中具有重要的作用。

SELECT member_name,time_add FROM personal_appeal WHERE YEAR(time_add) = 2017;

MYSQL 使用 YEAR 函数从日期中提取年份

DBMS提供的功能远不止简单的日期成分提取。大多数DBMS具有比较日期、执行基于日期的运算、选择日期格式等的函数。

不同DBMS的日期-时间处理函数可能不同。详见相应文档

8.2.3 数值处理函数

数值处理函数仅处理数值数据。这些函数一般主要用于代数、三角或几何运算，因此没有串或日期-时间处理函数的使用那么频繁

常用的数值处理函数：

本章介绍如何使用SQL的数据处理函数。这些函数在格式化、处理和过滤数据中非常有用，但它们在各种SQL实现中很不一致。

第九章汇总数据

　　本章介绍什么是SQL的聚集函数以及如何利用它们汇总表的数据。

9.1 聚集函数

经常需要汇总数据而不用实际检索出来，SQL提供了专门的函数。使用这些函数，SQL查询可用于检索数据，以便分析和报表生成。

这种类型的检索例子有：

　　确定表中行数（或者满足某个条件或包含某个特定值的行数）

　　获得表中行组的和

　　找出表列（或所有行或某些特定的行）的最大、最小、平均值。

上述例子都需要对表中数据汇总而不是检索实际数据本身。因此，返回实际表数据是对时间和处理资源的一种浪费（更不用说带宽）。

　　为方便这种类型的检索，SQL给出了5个聚集函数。

　　聚集函数：运行在行组上，计算和返回单个值的函数

9.1.1 AVG（）函数

通过对表中行数计数并计算特定列值之和，求得该列的平均值。

AVG（）可用来返回所有列的平均值，也可以用来返回特定列或行的平均值。

使用AVG（）返回 member_jifen 表中所有用户的平均总积分

AVG（）函数只能用来确定特定数值列的平均值，而且列名必须作为函数参数给出。

NULL值：AVG（）函数忽略列值为NULL的行

9.1.2 COUNT（）函数

COUNT（）函数进行计数。可用COUNT（）确定表中行的数目或符合特定条件的行的数目。

COUNT（）函数有两种使用方式：

　　使用COUNT(*)对表中行的数目进行计数，不管表列中包含的是空值（NULL）还是非空值。

　　使用COUNT（column）对特定列中具有值的行进行计数，忽略NULL值。

利用 COUNT(*)对所有行计数，不管行中各列有什么值。计数值在num_member中返回。

只对绑定了邮箱的客户计数

NULL值：如果指定列名，指定列的值为空的行被COUNT（）函数忽略，但如果 COUNT（）函数中用的是星号*，则不忽略

9.1.3 MAX（）函数

　　MAX（）返回指定列中的最大值。MAX（）要求指定列名。

返回member_id值最大的用户名和member_id

NULL值：MAX（）函数忽略列值为NULL的行

9.1.4 MIN（）函数

MIN（）函数返回指定列的最小值。与MAX（）一样，MIN（）要求指定列名

用法同 MAX（）

9.1.5 SUM（）函数

SUM（）用来返回指定列值的和（总计）。

列出2017年添加的用户的所有安全分数值

9.2 聚集不同值

以上5个聚集函数都可以如下使用：

　　对所有的行执行计算，指定ALL参数或不给参数（因为ALL是默认行为）

　　只包含不同的值，指定DISTINCT参数

　　ALL为默认：ALL参数不需要指定，因为它是默认行为。如果不指定DISTINCT,则假定为ALL

9.3 组合聚集函数

SELECT语句可以根据需要包含多个聚集函数

用单条SELECT语句执行了4个聚集计算，返回4个值。

取别名：在指定别名以包含某个聚集函数的结果时，不应该使用表中实际的列名。虽然这样做并非不合法，但许多SQL实现不支持，可能会产生模糊的错误消息。

聚集函数用来汇总数据。SQL支持5个聚集函数，可以用多种方法使用它们以返回所需的结果。

这些函数是高效设计的，它们返回结果一般比你在自己的客户机应用程序中计算要快得多。

第十章分组数据

本章介绍如何分组数据，以便能汇总表内容的子集。

设计两个新SELECT语句子句，分别是：GROUP BY 子句和 HAVING 子句

10.1 数据分组

分组允许把数据分为多个逻辑组，以便能对每个组进行聚集计算

创建分组

分组是在SELECT语句的GROUP BY 子句中建立的。

上面的SELECT子句指定了两个列，num_item为计算字段，表示当前积分数的总个数，

GROUP BY子句指示DBMS按tota_jf 排序并分组数据

GROUP BY子句指示DBMS分组数据，然后对每个组而不是整个结果集进行聚集

使用GROUP BY子句前，需要知道一些重要规定：

　　1.GROUP BY子句可以包含任意数目的列。这使得能对分组进行嵌套，为数据分组提供更细致的控制。

　　2.如果在GROUP BY子句中嵌套了分组，数据将在最后规定的分组上进行汇总

　　3.GROUP BY子句中列出的每个列都必须是检索列或有效地表达式（但不能是聚集函数）。

　　在SELECT中使用表达式，必须在GROUP BY 子句中指定相同的表达式，不能使用别名。

　　4.大多数SQL实现不允许GROUP BY列带有长度可变的数据类型（如文本或备注型字段）

　　如果分组列中具有NULL值，则NULL将作为一个分组返回。如果列中有多行NULL值，它们将分为一组。

　　5.GROUP BY子句必须出现在WHERE子句之后，ORDER BY子句之前。

10.2 过滤分组

除了能用GROUP BY分组数据外，SQL还允许过滤分组，规定包括哪些分组，排除哪些分组。

列出至少有两个相同总积分的会员，为得出这种数据，必须基于完整的分组而不是个别的行进行过滤。

WHERE过滤指定的是列而不是分组。WHERE没有分组的概念

HAVING类似于WHERE，目前为止学过的所有类型的WHERE子句都可以用HAVING来替代。唯一的差别是WHERE过滤行，HAVING过滤分组。

HAVING支持所有的WHERE操作符

HAVING和WHERE的差别：

WHERE在数据分组前进行过滤，HAVING在数据分组后进行过滤。

WHERE排除的行不包括在分组中。这可能会改变计算值，从而影响HAVING子句中基于这些值过滤掉的分组。

应该仅在与GROUP BY子句结合时才使用HAVING，而WHERE子句用于标准的行级过滤。

10.3 分组和排序

三、函数 （SUM、MIN、MAX、COUNT、AVG）

三、函数（SUM、MIN、MAX、COUNT、AVG）