数据库索引失效全总结

时间:2021-06-17

几乎所有的小伙伴都可以随口说几句关于创建索引的优缺点,也知道什么时候创建索引能够提高我们的查询性能,什么时候索引会更新,但是你有没有注意到,即使你设置了索引,有些时候索引他是不会生效的!这不仅考察了大家对索引的了解程度,还要让大家在使用的时候能够正确的使用。以下介绍了一些可能会造成索引失效的特殊情况,希望大家在平时开发和面试的时候能够注意到!

一、如何判断数据库索引是否生效

首先在接着探讨之前,我们先说一下,如何判断数据库的索引是否生效!相信大家应该猜到了,就是explain!explain显示了MySQL如何使用索引来处理select语句以及连接表。他可以帮助选择更好的索引和写出更优化的查询语句。

例如我们有一张表user,为name列创建索引name_index,如下所示: 这里写图片描述 使用explain分析语句如下: 这里写图片描述 可以看到,使用explain显示了很多列,各个关键字的含义如下:

  • table:顾名思义,显示这一行的数据是关于哪张表的;

  • type:这是重要的列,显示连接使用了何种类型。从最好到最差的连接类型为:const、eq_reg、ref、range、indexhe和ALL;

  • possible_keys:显示可能应用在这张表中的索引。如果为空,没有可能的索引。可以为相关的域从where语句中选择一个合适的语句;

  • key: 实际使用的索引。如果为NULL,则没有使用索引。很少的情况下,MySQL会选择优化不足的索引。这种情况下,可以在Select语句中使用USE INDEX(indexname)来强制使用一个索引或者用IGNORE INDEX(indexname)来强制MySQL忽略索引;

  • key_len:使用的索引的长度。在不损失精确性的情况下,长度越短越好;

  • ref:显示索引的哪一列被使用了,如果可能的话,是一个常数;

  • rows:MySQL认为必须检查的用来返回请求数据的行数;

  • Extra:关于MySQL如何解析查询的额外信息。

具体的各个列所能表示的值以及含义可以参考MySQL官方文档介绍,地址:https://dev.mysql.com/doc/refman/5.7/en/explain-output.html

二、哪些场景会造成索引生效

1、应尽量避免在 where 子句中使用 != 或 <> 操作符

否则引擎将放弃使用索引而进行全表扫描;

这里写图片描述

2、尽量避免在 where 子句中使用 or 来连接条件

否则将导致引擎放弃使用索引而进行全表扫描,即使其中有条件带索引也不会使用,这也是为什么尽量少用 or 的原因;

这里写图片描述

3、对于多列索引,不是使用的第一部分,则不会使用索引;

这句话某种程度上有问题,详细请参考:本文《第三节:最左前缀原则》

4、如果列类型是字符串,那一定要在条件中将数据使用引号引用起来,否则不会使用索引;

这里写图片描述

5、like的模糊查询以 % 开头,索引失效;

这里写图片描述 但是非前导模糊查询则可以:

select * from user where name like xuliu%';

6、应尽量在 where 子句中对字段进行表达式操作

这将导致引擎放弃使用索引而进行全表扫描;

select id from t where num/2 = 100

应改为:

select id from t where num = 100*2;

7、应尽量在 where 子句中对字段进行函数操作

这将导致引擎放弃使用索引而进行全表扫描;

select id from t where substring(name,1,3) = 'abc' – name;

以abc开头的,应改成:

select id from t where name like ‘abc%’
select id from t where datediff(day, createdate, '2005-11-30') = 0 – '2005-11-30';

应改为:

select id from t where createdate >= '2005-11-30' and createdate < '2005-12-1';

8、不要在 where 子句中的 “=” 左边进行函数、算术运算或其他表达式运算

否则系统将可能无法正确使用索引;

9、如果MySQL估计使用全表扫描要比使用索引快,则不使用索引;

10、不适合键值较少的列(重复数据较多的列)

假如索引列TYPE有5个键值,如果有1万条数据,那么 WHERE TYPE = 1将访问表中的2000个数据块。再加上访问索引块,一共要访问大于200个的数据块。如果全表扫描,假设10条数据一个数据块,那么只需访问1000个数据块,既然全表扫描访问的数据块少一些,肯定就不会利用索引了。

三、最左前缀原则

最左前缀原则:顾名思义是最左优先,以最左边的为起点任何连续的索引都能匹配上。

(1)如果第一个字段是范围查询需要单独建一个索引;

(2)在创建多列索引时,要根据业务需求,where子句中使用最频繁的一列放在最左边;

当创建(a,b,c)复合索引时,想要索引生效的话,只能使用 a和ab、ac和abc三种组合!

实例:以下是常见的几个查询:

mysql>SELECT `a`,`b`,`c` FROM A WHERE `a`='a1' ; //索引生效 mysql>SELECT `a`,`b`,`c` FROM A WHERE `b`='b2' AND `c`='c2'; //索引失效 mysql>SELECT `a`,`b`,`c` FROM A WHERE `a`='a3' AND `c`='c3'; //索引生效,实际上值使用了索引a

扩展:想要索引最大化的使用需要至少建几个索引?

答:需要建立复合索引:bc

3.1、三个字段联合索引测试:

在这里插入图片描述 联合索引的顺序为:sex,age,name

SELECT * FROM user where sex="3"; #使用索引 SELECT * FROM user where age="4"; #未使用索引 SELECT * FROM user where name="2"; #未使用索引 SELECT * FROM user where sex="2" and age="3"; #使用索引 SELECT * FROM user where sex="2" and age="3" and name="4"; #使用索引 SELECT * FROM user where age="3" and name="4"; #未使用索引 SELECT * FROM user where sex="2" and name="4"; #使用索引 #这个在3.2最后边解释,为什么 explain SELECT * FROM index_demo.user where age="2" and sex="3"; #使用索引

值得注意的是,where sex=“2” and name=“4” 这个相当于只有sex使用到了索引的,

在这里插入图片描述 和where sex=“2” and age=“3” and name="4"的区别:

在这里插入图片描述

3.2、如果索引字段有两个

如果索引有两个字段:sex,age

在这里插入图片描述

explain SELECT * FROM index_demo.user where sex="3"; #使用索引 explain SELECT * FROM index_demo.user where age="4"; #未使用索引 explain SELECT * FROM index_demo.user where sex="2" and age="3"; #使用索引 explain SELECT * FROM index_demo.user where age="3" and sex="4"; #使用索引

在这里插入图片描述 在这里插入图片描述 where sex=“2” and age=“3”;和where sex=“2” and age=“3”;

这两个都是用了索引的,这是mysql查询优化器,mysql查询优化器会判断纠正这条sql语句该以什么样的顺序执行效率最高,最后才生成真正的执行计划。所以,当然是我们能尽量的利用到索引时的查询顺序效率最高咯,所以mysql查询优化器会最终以这种顺序进行查询执行。

然后回到刚才的3.1中三个索引的时候:sex,age,name

explain SELECT * FROM index_demo.user where age="2" and sex="3"; #使用索引

这条语句竟然使用索引了 在这里插入图片描述 可以看出他是使用索引了,因为对于三个索引的时候,只要是前两个,存在,不论顺序是什么都是会使用索引的,这里主要是mysql查询优化器起的作用了;

参考文章:

1、http://blog.csdn.net/qq_33774822/article/details/61197420

【推荐】 mysql协议详解
【推荐】 分库分表的几种常见形式以及可能遇到的难题
【推荐】 NoSQL 简介
【推荐】 史上最全阿里技术面试题目