解读阿里巴巴Java手册：为什么禁止使用 count(列名)或 count(常量)来替代 count(*)

tech2022-07-13 290

虽然在规定的说明上已经简单的说明了下为什么，但是说的不够详细和全面，我们来看下不用引擎之间的差别：

MyISAM引擎把一个表的总行数记录在了磁盘上，执行count(*)会直接返回这个数值，效率很高。InnoDB，执行count(*)，需要把数据一行行的从引擎中读出来，然后累积计数。

MyISAM做了一个简单的优化，那就是它可以把表的总行数单独记录下来，如果从一张表中使用COUNT(*)进行查询的时候，可以直接返回这个记录下来的数值就可以了，前提是没有where条件。

InnoDB需要把数据一行行从数据库读出来，是不是在数据量大的情况下会非常慢，不用紧张，MySQL对InnoDB引擎已经优化：

InnoDB是索引组织表，主键索引的叶子节点保存的是数据，普通索引的叶子节点保存的是主键值，普通索引比主键索引小，对于count(*)这样的操作，遍历哪个索引树得到的结果逻辑上是一样的，因此，MySQL优化器会找到最小的索引树来遍历，在保证逻辑正确的前提下，尽量减少扫描的数据量。

MySQL会优先选择最小的非聚簇索引来扫表。所以，当我们建表的时候，除了主键索引以外，创建一个非主键索引还是有必要的

count统计传参不同，如何执行，性能怎样？

count(主键id)：InnoDB引擎会遍历整张表，把每一行id值都取出来，返给server层。server层拿到id后，判断是不可能为空的，就按行累加，不再对每个值进行NULL判断。count(1)：InnoDB引擎会遍历整张表，但不取值。server层对于返回的每一行，放一个数字“1”进去，判断是不可能为空的，按行累加，不再对每个值进行NULL判断。count(1)比count(主键id)执行的要快，因为从引擎放回id会涉及解析数据行，以及拷贝字段值的操作。count(字段)：只包含列名的列，统计表中出现该字段的次数，并且不统计字段为null的情况； 1、如果参数字段定义NOT NULL，判断是不可能为空的，按行累加，不再对每个值进行NULL判断。 2、如果参数字段定义允许为NULL，那么执行的时候，判断可能是NULL，还要把值取出来再判断一下，不是NULL才累加。count(*)：统计所有的列，相当于行数，统计结果中会包含字段值为null的列；

COUNT(*)是SQL92定义的标准统计行数的语法，并且效率高，所以请直接使用COUNT(*)查询表的行数！

最新回复(0)