登录
首页 >  数据库 >  MySQL

浅析MySQL索引

来源:SegmentFault

时间:2023-01-16 17:25:30 115浏览 收藏

来到golang学习网的大家,相信都是编程学习爱好者,希望在这里学习数据库相关编程知识。下面本篇文章就来带大家聊聊《浅析MySQL索引》,介绍一下MySQL,希望对大家的知识积累有所帮助,助力实战开发!

前言

在MySQL中,索引的概念就相当于书本的目录,目的是帮助MySQL高效的获取到数据,提高查询效率。

索引模型

一般我们经常提到的索引模型有B+Tree索引和哈希索引。

哈希索引

哈希索引实际上就是一组k-v,将k键经过哈希函数计算出一个哈希码,将哈希码进行索引存储,同时记录每个哈希码指向数据行的指针。
所以,哈希索引对于

f=1,f in(1,2,3)
这种查询是相当快速的,但是因为其是无序的,所以范围查询效率很低。
B+ Tree

先看一下B+Tree索引结构图:

b+tree.png

通过上面的结构图可以看到,在B+Tree的索引结构中,分为主键索引(聚簇索引)和辅助键索引(辅助索引,非聚簇索引),根节点和中间节点存储的是索引key,其中主键索引的叶子节点上存放数据,辅助键索引的叶子节点上存放主键索引值。
图示没有显示出来的是,每个叶子节点之间还有指针指向相邻叶子节点
,即5数据列存在访问到7数据列的指针,7数据列存在访问到11数据列的指针...,这样在顺序访问数据时,就提高了区间访问的效率。

比如我们需要查找key从5~14的数据,那么只用找到key为5的数据,然后根据叶子节点上的指针顺序往后访问,直到判断key>14截止即可,不用再回到根节点遍历查找,这样就节省了IO操作,提高了查找效率。

再查看图示辅助键索引,可以看出来,辅助键索引的查询,需要通过辅助键索引找到主键索引key,然后再根据主键索引key去主键索引树中查找数据,这也是为什么辅助键索引效率比主键索引低的原因,因为使用辅助键索引会多扫描一棵索引树,这就是MySQL查询中回表的概念。

需要注意的是,MySQL中的B+Tree索引一般是2~4层,而且InnoDB存储引擎在设计时是将根节点常驻内存的,也就是说,查找某个键值得行记录最多只需要1~3次磁盘IO操作。

在网上看到关于数据库索引采用B+Tree的原因,个人觉得写的很好:
BTree在提高了IO性能的同时,并没有解决元素遍历时效率低下的问题,正是为了解决这个问题,B+Tree应运而生。B+Tree只需要去遍历叶子节点就可以实现整个树的遍历,而在数据库中基于范围的查询是非常频繁的,BTree不支持这样的操作或者说效率太低。(BTree每个节点上都带有数据行信息)

在B+Tree结构中进行插入和删除操作时,为了维护索引的有序性,会触发数据页的页分裂和页合并。
比如说我们在中间插入一条数据,那么为了让数据能正确插入并保持索引的有序性,B+Tree就会将一部分数据数据,以便当前数据能正确插入,这样就使得性能受到影响。相反,当我们删除数据过多,相邻数据页利用率过低,B+Tree就会将数据页进行合并,提高空间利用率。
正是基于插入的无序性导致效率降低,所以应该尽量设置一个自增字段作为主键,追加数据就只用将数据往后放,不涉及到数据挪动的情况。
但是,事无绝对,有些数据表只有一个唯一字段,且没有其他索引,字段也没几个,那么我们也不必要非要设置一个自增ID做主键,这样查询还需要回表,反而浪费了时间,这种情况就将唯一字段作为主键即可。

索引分类

前面,我们从索引存储结构上分析了B+Tree索引和哈希索引。
平时我们从应用层面上一般将索引分为普通索引,唯一索引,主键索引,复合索引等。
普通索引即一个索引只包含单个列,一个表可以有多个单列索引;
唯一索引即索引列必须唯一,但是可为空;
主键索引即唯一索引的特殊类型,不可为空,可多行;
复合索引即一个索引包含多个列。

索引覆盖

通过复合索引,我们可以引出索引覆盖的概念:
即在复合索引的查询状态下,假设需要的行记录恰好包含在复合索引中或查询的是主键字段,那么此时结果将直接从复合索引中得到,省去了回表的过程,这样可以大大减少IO,提高效率。

最左原则

索引的最左原则是在复合索引中,如果定义了索引字段为

(a,b)
,那么访问使用
(a,b),(a)
是有效的,单单使用
(b)
是无效的。
如果a是字符串索引,使用了
where a like 'z%'
,这样的格式,也是可以使用到a索引的。
也就是说,最左原则是复合索引的最左N个字段,也可以是字符串索引的最左M个字符。
索引下推

在联合索引

(a,b)
中,如
where a like 'abc%' and b>5
条件查询时,在MySQL5.6之前,会在匹配到a字段的值后,根据主键key进行回表,查询数据后再判断b是否>5。但是在5.6版本后,MySQL会在匹配到a字段的值后,在非聚簇索引树中直接过滤b的值,然后进行回表查询,减少回表次数,提高查询效率。

最后

这篇文章主要讲了MySQL中:
根据索引模型划分的常见的B+Tree索引和哈希索引;
根据应用划分的主键索引,普通索引,复合索引,唯一索引。
之后又引申了索引的最左原则和索引下推的概念。

你可以看到,日常我们使用数据库,在满足sql查询结果的情况下,应尽量提高效率,合理获取数据,正确设计表结构。

终于介绍完啦!小伙伴们,这篇关于《浅析MySQL索引》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布数据库相关知识,快来关注吧!

声明:本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
评论列表