浅析MySQL索引
来源:SegmentFault
时间:2023-01-16 17:25:30 115浏览 收藏
来到golang学习网的大家,相信都是编程学习爱好者,希望在这里学习数据库相关编程知识。下面本篇文章就来带大家聊聊《浅析MySQL索引》,介绍一下MySQL,希望对大家的知识积累有所帮助,助力实战开发!
前言
在MySQL中,索引的概念就相当于书本的目录,目的是帮助MySQL高效的获取到数据,提高查询效率。
索引模型
一般我们经常提到的索引模型有B+Tree索引和哈希索引。
哈希索引
哈希索引实际上就是一组k-v,将k键经过哈希函数计算出一个哈希码,将哈希码进行索引存储,同时记录每个哈希码指向数据行的指针。
所以,哈希索引对于
f=1,f in(1,2,3)这种查询是相当快速的,但是因为其是无序的,所以范围查询效率很低。
B+ Tree
先看一下B+Tree索引结构图:
通过上面的结构图可以看到,在B+Tree的索引结构中,分为主键索引(聚簇索引)和辅助键索引(辅助索引,非聚簇索引),根节点和中间节点存储的是索引key,其中主键索引的叶子节点上存放数据,辅助键索引的叶子节点上存放主键索引值。
图示没有显示出来的是,每个叶子节点之间还有指针指向相邻叶子节点,即5数据列存在访问到7数据列的指针,7数据列存在访问到11数据列的指针...,这样在顺序访问数据时,就提高了区间访问的效率。
比如我们需要查找key从5~14的数据,那么只用找到key为5的数据,然后根据叶子节点上的指针顺序往后访问,直到判断key>14截止即可,不用再回到根节点遍历查找,这样就节省了IO操作,提高了查找效率。
再查看图示辅助键索引,可以看出来,辅助键索引的查询,需要通过辅助键索引找到主键索引key,然后再根据主键索引key去主键索引树中查找数据,这也是为什么辅助键索引效率比主键索引低的原因,因为使用辅助键索引会多扫描一棵索引树,这就是MySQL查询中回表的概念。
需要注意的是,MySQL中的B+Tree索引一般是2~4层,而且InnoDB存储引擎在设计时是将根节点常驻内存的,也就是说,查找某个键值得行记录最多只需要1~3次磁盘IO操作。
在网上看到关于数据库索引采用B+Tree的原因,个人觉得写的很好:
BTree在提高了IO性能的同时,并没有解决元素遍历时效率低下的问题,正是为了解决这个问题,B+Tree应运而生。B+Tree只需要去遍历叶子节点就可以实现整个树的遍历,而在数据库中基于范围的查询是非常频繁的,BTree不支持这样的操作或者说效率太低。(BTree每个节点上都带有数据行信息)
在B+Tree结构中进行插入和删除操作时,为了维护索引的有序性,会触发数据页的页分裂和页合并。
比如说我们在中间插入一条数据,那么为了让数据能正确插入并保持索引的有序性,B+Tree就会将一部分数据数据,以便当前数据能正确插入,这样就使得性能受到影响。相反,当我们删除数据过多,相邻数据页利用率过低,B+Tree就会将数据页进行合并,提高空间利用率。
正是基于插入的无序性导致效率降低,所以应该尽量设置一个自增字段作为主键,追加数据就只用将数据往后放,不涉及到数据挪动的情况。
但是,事无绝对,有些数据表只有一个唯一字段,且没有其他索引,字段也没几个,那么我们也不必要非要设置一个自增ID做主键,这样查询还需要回表,反而浪费了时间,这种情况就将唯一字段作为主键即可。
索引分类
前面,我们从索引存储结构上分析了B+Tree索引和哈希索引。
平时我们从应用层面上一般将索引分为普通索引,唯一索引,主键索引,复合索引等。
普通索引即一个索引只包含单个列,一个表可以有多个单列索引;
唯一索引即索引列必须唯一,但是可为空;
主键索引即唯一索引的特殊类型,不可为空,可多行;
复合索引即一个索引包含多个列。
索引覆盖
通过复合索引,我们可以引出索引覆盖的概念:
即在复合索引的查询状态下,假设需要的行记录恰好包含在复合索引中或查询的是主键字段,那么此时结果将直接从复合索引中得到,省去了回表的过程,这样可以大大减少IO,提高效率。
最左原则
索引的最左原则是在复合索引中,如果定义了索引字段为
(a,b),那么访问使用
(a,b),(a)是有效的,单单使用
(b)是无效的。
如果a是字符串索引,使用了
where a like 'z%',这样的格式,也是可以使用到a索引的。
也就是说,最左原则是复合索引的最左N个字段,也可以是字符串索引的最左M个字符。
索引下推
在联合索引
(a,b)中,如
where a like 'abc%' and b>5条件查询时,在MySQL5.6之前,会在匹配到a字段的值后,根据主键key进行回表,查询数据后再判断b是否>5。但是在5.6版本后,MySQL会在匹配到a字段的值后,在非聚簇索引树中直接过滤b的值,然后进行回表查询,减少回表次数,提高查询效率。
最后
这篇文章主要讲了MySQL中:
根据索引模型划分的常见的B+Tree索引和哈希索引;
根据应用划分的主键索引,普通索引,复合索引,唯一索引。
之后又引申了索引的最左原则和索引下推的概念。
你可以看到,日常我们使用数据库,在满足sql查询结果的情况下,应尽量提高效率,合理获取数据,正确设计表结构。
终于介绍完啦!小伙伴们,这篇关于《浅析MySQL索引》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布数据库相关知识,快来关注吧!
-
499 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
101 收藏
-
214 收藏
-
155 收藏
-
485 收藏
-
436 收藏
-
125 收藏
-
174 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习