解读阿里巴巴Java手册:为什么禁止使用 count(列名)或 count(常量)来替代 count(*)

tech2022-07-13  126

虽然在规定的说明上已经简单的说明了下为什么,但是说的不够详细和全面,我们来看下不用引擎之间的差别:

MyISAM引擎把一个表的总行数记录在了磁盘上,执行count(*)会直接返回这个数值,效率很高。InnoDB,执行count(*),需要把数据一行行的从引擎中读出来,然后累积计数。

MyISAM做了一个简单的优化,那就是它可以把表的总行数单独记录下来,如果从一张表中使用COUNT(*)进行查询的时候,可以直接返回这个记录下来的数值就可以了,前提是没有where条件。

InnoDB需要把数据一行行从数据库读出来,是不是在数据量大的情况下会非常慢,不用紧张,MySQL对InnoDB引擎已经优化:

InnoDB是索引组织表,主键索引的叶子节点保存的是数据,普通索引的叶子节点保存的是主键值,普通索引比主键索引小,对于count(*)这样的操作,遍历哪个索引树得到的结果逻辑上是一样的,因此,MySQL优化器会找到最小的索引树来遍历,在保证逻辑正确的前提下,尽量减少扫描的数据量。

MySQL会优先选择最小的非聚簇索引来扫表。所以,当我们建表的时候,除了主键索引以外,创建一个非主键索引还是有必要的

count统计传参不同,如何执行,性能怎样?

count(主键id):InnoDB引擎会遍历整张表,把每一行id值都取出来,返给server层。server层拿到id后,判断是不可能为空的,就按行累加,不再对每个值进行NULL判断。count(1):InnoDB引擎会遍历整张表,但不取值。server层对于返回的每一行,放一个数字“1”进去,判断是不可能为空的,按行累加,不再对每个值进行NULL判断。count(1)比count(主键id)执行的要快,因为从引擎放回id会涉及解析数据行,以及拷贝字段值的操作。count(字段):只包含列名的列,统计表中出现该字段的次数,并且不统计字段为null的情况; 1、如果参数字段定义NOT NULL,判断是不可能为空的,按行累加,不再对每个值进行NULL判断。 2、如果参数字段定义允许为NULL,那么执行的时候,判断可能是NULL,还要把值取出来再判断一下,不是NULL才累加。count(*):统计所有的列,相当于行数,统计结果中会包含字段值为null的列;

COUNT(*)是SQL92定义的标准统计行数的语法,并且效率高,所以请直接使用COUNT(*)查询表的行数!

最新回复(0)