使用explain关键字,可以模拟优化器执行SQL语句查询,从而知道MySQL如果处理你的SQL语句,分析语句的性能瓶颈。
使用explain关键字可以模拟优化器执行SQL查询语句,从而得知MySQL是如何处理SQL语句的。
+----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+ | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra | +----+-------------+-------+------------+------+---------------+-----+---------+------+------+----------+-------+select查询的序列号,包含一组可以重复的数字,表示查询中执行SQL语句的顺序,一般有三种情况:
1、id全部相同,SQL的执行顺序是由上至下。 2、id全部不同,SQL的执行顺序是根据id大的优先执行。 3、id既存在相同,又存在不同的,先根据id大的优先执行,再根据相同id从上至下执行
simple:简单的select查询,查询中不包含子查询或者union primary:查询中若包含任何复杂的子查询,最外层查询则被标记为primary subquery:在select或where列表中包含了子查询 derived:在from列表中包含的子查询被标记为derived(衍生),MySQL会递归执行这些子查询,把结果放在临时表里。 union:若第二个select出现在union后,则被标记为union,若union包含在from子句的子查询中,外层select将被标记为:derived union result:从union表获取结果的select
这是一个非常重要的参数,连接类型,常见的有:all、index、range、ref、eq_ref、const、system、null八个级别。 性能从最优到最差的排序:system>const>eq_ref>ref>range>index>all 对java程序员来说,若保证查询至少达到range级别或者最好能达到ref则算是一个优秀而又负责的程序员。 all:全表扫描。全表扫描无疑是最差的,若是百万千万数据量,全表扫描会非常慢。 index:索引全表扫描。全索引文件扫描比all好很多,毕竟从索引树中找数据,比从全表中找数据要快。 range:索引范围扫描。只检索给定范围的行,使用索引来匹配行。范围缩小了,当然比全表扫描和全索引扫描要快。SQL语句中一般会有between,in,>,< 等查询。 ref:非唯一性索引扫描。本质上也是一种索引访问,返回所有匹配某个单独值的行。比如查询公司所有数据研发团队的同事,匹配的结果是多个并非唯一值。 eq_ref:唯一性索引扫描。对于每个索引键,表中有一条记录与之匹配。比如查询公司的CEO,匹配的结果只可能是一条记录。 const:表示通过索引一次就可以找到,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快,若将主键置于where列表中,MySQL就能将该查询转换为一个常量。 system:表只有一条记录(等于系统表),这是const类型的特列,平时不会出现,了解即可。
显示查询语句可能用到的索引(一个或多个或为null),不一定被查询实际使用。
显示查询语句实际使用的索引。若为null,则表示没有使用索引。select_type为index_merge时,这里可能出现两个以上的索引,其他的select_type这里只会出现一个。
显示索引中使用的字节数,可通过key_len计算查询中使用的索引长度。在不损失精确性的情况下索引长度越短越好。另外,key_len只计算where条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到key_len中。
如果是使用的常数等值查询,这里会显示const,如果是连接查询,被驱动表的执行计划这里会显示驱动表的关联字段,如果是条件使用了表达式或者函数,或者条件列发生了内部隐式转换,这里可能显示为func
这里是执行计划中估算的扫描行数,不是精确值,值越大越不好。
Using filesort: 说明MySQL会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序” 。出现这个就要立刻优化sql。 Using temporary: 使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和 分组查询 group by。 出现这个更要立刻优化sql。 Using index: 表示相应的select 操作中使用了覆盖索引(Covering index),避免访问了表的数据行,效果不错!如果同时出现Using where,表明索引被用来执行索引键值的查找。如果没有同时出现Using where,表示索引用来读取数据而非执行查找动作。 Using index condition: 在5.6版本后加入的新特性,优化器会在索引存在的情况下,通过符合RANGE范围的条数 和 总数的比例来选择是使用索引还是进行全表遍历。 Using where: 表明使用了where 过滤 Using join buffer: 表明使用了连接缓存 impossible where: where 语句的值总是false,不可用,不能用来获取任何元素 distinct: 优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。
一个百分比的值,和rows 列的值一起使用,可以估计出查询执行计划(QEP)中的前一个表的结果集,从而确定join操作的循环次数。小表驱动大表,减轻连接的次数。
通过explain之后,我们可以通过一些属性的优化: id属性:通过id属性我们能够准确知道查询语句的执行属性,同时结合小表驱动大表的原则进行优化。 type属性:至少优化到range级别。 key_len属性:在不损失精确性的情况下索引长度越短越好。 rows属性:看是否减少扫描行数。 extra属性:如果出现Using filesort Using temporary必须优化,如果出现Using index那就完美了
有关覆盖索引的理解: 就是select 的数据列只有从索引中就能够获得,不必读取数据行,MySQL可以利用索引返回select 列表中的字段,而不必根据索引再次读取数据文件。 什么意思呢?比如有张a表,表里有关id属性,同时id是添加主键索引的。 select * form a where a=‘1’ 这个时候通过索引很快找到唯一一条数据,但还会通过这个属性去表中找到这行的其它属性,因为你是select* 但如果你改成select id form a where a=‘1’ 那你通过索引获得这个数据后,不需要在获取这条数据的其它信息,那就不用再去查询该表,而是直接把信息返回出来。