在 SQL 中 Count(*) 或者 Count(1) 或者 Count([列]) 或许是最常用的聚合函数。很多人其实对这三者之间是区分不清的。往常我经常会看到一些所谓的优化建议不使用 Count(*) 而是使用 Count(1) 从而可以提升性能,给出的理由是Count(*)会带来全表扫描,而实际上如何写Count并没有区别。
一、count(1)里的1表示什么
count(1) 其实就是计算一共有多少符合条件的行。1 并不是表示第一个字段,而是表示一个固定值。
其实就可以想成表中有这么一个字段,这个字段就是固定值1,count(1) 就是计算一共有多少个1。同理 count(2) 也可以,得到的值完全一样,count('x'),count('y')都是可以的,一样的理解方式。在这个语句里都可以使用,返回的值完全是一样的,就是计数。
count(*) 执行时会把星号翻译成字段的具体名字,效果也是一样的,不过多了一个翻译的动作,比固定值的方式效率稍微低一些。
二、count(1)、count(*)与count(列名)的执行区别
1、执行效果
(1)count(1) and count(*)
如果count(1)是聚索引、id,那肯定是count(1)快,但是差的很小的。 因为 count(*) 自动会优化指定到那一个字段。所以没必要去count(1),用count(*),sql会帮你完成优化的。因此: count(1)和count(*)基本没有差别!
(2)count(*) 和count(列名) 两者查询差异的原因分析
在数据记录都不为空的时候查询出来结果上没有差别的。
count(*)(是针对全表)将返回表格中所有存在的行的总数包括值为null的行;
count(1) 会统计表中的所有的记录数, 包含字段为null 的记录。
count(列名)(是针对某一列)将返回表格中某一列除去null以外的所有行的总数。会统计该字段在表中出现的次数,忽略字段为null 的情况,即不统计字段为null 的记录。
(3)执行效果上 :
count(*) 包括了所有的列,相当于行数,在统计结果的时候, 不会忽略列值为NULL
count(1) 包括了忽略所有列,用1代表代码行,在统计结果的时候, 不会忽略列值为NULL
count(列名) 只包括列名那一列,在统计结果的时候,会忽略列值为空(这里的空不是指空字符串或者0,而是表示null)的计数, 即某个字段值为NULL时,不统计。
2、执行效率上:
列名为主键,count(列名) 会比 count(1) 快 ;
列名不为主键,count(1) 会比count(列名)快;
如果表多个列并且没有主键,则 count(1) 的执行效率优于 count(*);
如果有主键,则 select count(主键)的执行效率是最优的;
如果表只有一个字段,则 select count(*)最优。