count(1)，count(*)，count(主键) 性能对比

前言

前段时间关于统计数量的sql问题和朋友进行了讨论，网上关于这三种查询方式说法不一，主要有以下两种说法。

count(*) = count(主键) > count(1)
count(主键) > count(*) > count(1)

今天对这三种方式进行探究。

数据库为mysql 5.7.12，引擎为InnoDB。

建表

CREATE TABLE `user` (
`id` int(32) NOT NULL AUTO_INCREMENT,
`name` varchar(500) DEFAULT NULL COMMENT '姓名',
`deleted` int(2) NOT NULL DEFAULT '1' COMMENT '逻辑删除',
`created_date` datetime DEFAULT NULL COMMENT '创建时间',
`created_by` varchar(255) DEFAULT NULL,
`update_date` datetime DEFAULT NULL,
`update_by` varchar(255) DEFAULT NULL,
`version` int(11) NOT NULL DEFAULT '1' COMMENT '乐观锁',
PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1502726 DEFAULT CHARSET=utf8 ROW_FORMAT=COMPACT COMMENT='用户表';

循环插入150万条数据。

DROP PROCEDURE
IF
EXISTS proc_initData;
DELIMITER $
CREATE PROCEDURE proc_initData () BEGIN
DECLARE
i INT DEFAULT 1;
WHILE
i <= 5000000 DO
INSERT INTO user ( name, created_date, update_date )
VALUES
( '哈哈哈啊哈哈哈', NOW(), NOW() );
SET i = i + 1;
END WHILE;
END $ CALL proc_initData ();

这里需要使用到mysql的explain关键字，对count(1)，count(*)，count(id)，count(name)分别查看性能

explain select count(1) from user
explain select count(*) from user
explain select count(id) from user
explain select count(name) from user

可以看出，select count(1)、count(*)、count(id)的执行计划是一毛一样的。多次执行取平均值，三者的性能也是非常趋近，因此可以认为三者性能相同。这里我加了个count(name)进行对比，并将最后30万条数据的name置空，可以看出性能有明显的差别。

mysql底层对count查询做了优化，当mysql确定count中的列名不为空时，实际上就是在统计行数。那么mysql内部会将count(列名)优化为count(*) —— 出自《高性能MySQL》一书

也就是说count(1)和count(主键字段)还是要优化到count(*)的，而如果只是统计某个列，只要该列不为空，无论是否为索引，都会被优化为count(*)，因此三者性能并无任何差异。官方文档对其也进行了解释。

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.

https://dev.mysql.com/doc/refman/5.7/en/group-by-functions.html#function_count

至此，事实上并未解决关于这个问题的疑惑。上面的内容都在强调“Mysql”，就是说，上面的验证可能仅对MySql有效，其他的数据库可能未必会对count语句进行优化。因此我又通过SQLServer去验证。

因为我本地并没有安装SQLServer，因此我是直接使用公司的开发库进行验证，这里不方便截图，直接说明一下200万条数据验证结果。

列名为主键，count(列名)会比count(1)快
列名不为主键，count(1)会比count(列名)快
如果表多个列并且没有主键，则 count（1）的执行效率优于 count（*）
如果有主键，则 select count（主键）的执行效率是最优的
如果表只有一个字段，则 select count（*）最优。

可见，在SQLServer中，count(*)的性能并没有count(主键)高。

结语

根据上面对两个数据库的验证得出结论：不说是什么数据库都是耍流氓！SQL标准只提供了count这个内置函数，所有的数据库需要遵循这个标准，但是不同的数据库对于count的处理不同。在mysql中建议写count(*)，而在SQLServer中建议写count(主键)，在PostgreSql以及其他数据库中并未对其进行验证

文章原文：https://blog.csdn.net/qq_36403693/article/details/103758765