Mysql性能优化:如何给字符串加索引?
来源:SegmentFault
时间:2023-02-16 15:20:46 366浏览 收藏
IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《Mysql性能优化:如何给字符串加索引?》,聊聊MySQL,我们一起来看看吧!
导读
- 现代大部分的登录系统都支持邮箱、手机号码登录两种方式,那么如何在邮箱或者手机号码这个字符串上建立索引才能保证性能最佳呢?
- 今天这篇文章就来探讨一下在Mysql中如何给一个字符串加索引才能达到性能最佳。
- 本文首发于作者的微信公众号【码猿技术专栏】,原创不易,喜欢的朋友支持一下,谢谢!!!
- 陈某将会从什么是前缀索引、前缀索引和普通索引的比较、如何建丽最佳性能的前缀索引、前缀索引对覆盖索引的影响这几段来讲。
前缀索引
- 顾名思义,对于列值较长,比如
BLOB
、TEXT
、VARCHAR
,就 "必须" 使用前缀索引,即将值的前一部分作为索引。因为索引的存储也是需要空间的,同样索引太长维护起来也比较困难。 - 比如我们给
User
表中的邮箱添加前缀索引,如下:alter table user add index index1(email(7));
- 上述语句将email的前7个字符作为索引。
前缀索引和普通索引比较
- 我们分别将
email
的全部作为索引和前7个字符作为索引来看看在性能上有什么差异。建立索引的语句如下:
alter table user add index index1(email);
alter table user add index index2(email(7));
- 假设有
user
表中有这样几条数据(id,name,email):(1,"陈某","chenmou1993@xxx")
、(2,"张某","chenmou1994@xxx")
、(3,"李某","chenmou1995@xxx")
、(4,"王某","chenmou1996@xxx")
。 - 对应于index1和index2的索引树如下两张图:


- 如果执行下面的查询语句,Mysql如何利用索引来查询呢?
select * from user where email="chenmou1995@xxx";
【1】普通索引的执行过程
- 从index1索引树找到满足索引值是
chenmou1995@xxx
的这条记录,取得id=2
的值; - 到主键上查到主键值是
id=2
的行,判断email的值是正确的,将这行记录加入结果集; - 取
index1
索引树上刚刚查到的位置的下一条记录,发现已经不满足email=chenmou1995@xxx
的条件了,循环结束。
这个过程中,只需要回主键索引取一次数据,所以系统认为只扫描了一行。
【2】前缀索引的执行过程
- 从index2索引树找到满足索引值是
chenmou
的记录,找到的第一个是id=1; - 到主键上查到主键值是id=1的行,判断出email的值不是
chenmou1995@xxx
,这行记录丢弃; - 取index2上刚刚查到的位置的下一条记录,发现仍然是
chenmou
,取出id=2,再到ID索引上取整行然后判断,这次值对了,将这行记录加入结果集; - 重复上一步,直到在idxe2上取到的值不是
chenmou
时,循环结束。
在这个过程中,要回主键索引取4次数据,也就是扫描了4行。
- 通过以上查询的对比,很容易就可以发现,使用前缀索引后,可能会导致查询语句读数据的次数变多。
- 但是对于这个查询语句来说,如果建立的前缀索引的长度为13呢?那么满足
chenmou1995
的记录只有一个,这样就可以直接定位到id=2
,此时不但空间缩小了,扫描的行数也减少了。 - 于是结论就来了:使用前缀索引,只要定义好长度,就可以做到既节省空间,又不用额外增加太多的查询成本。
- 那么如何建立正确的前缀索引才能达到最佳的性能呢?接着往下看................
如何建立最佳性能的前缀索引
- 通过上述的比较,可以得出一个结论,建立前缀索引的区分度越高越好,意味着重复的键值越少。
- 那么如何统计区分度,其实很简单,只需要判断数据库中重复的次数即可。sql如下:
select
count(distinct left(email,4))as L4,
count(distinct left(email,5))as L5,
count(distinct left(email,6))as L6,
count(distinct left(email,7))as L7,
from user;
- 但是如果对于使用前缀区分度不太好的情况,比如,我们国家的身份证号,一共18位,其中前6位是地址码,所以同一个县的人的身份证号前6位一般会是相同的。 这时候如果对身份证号做长度为6的前缀索引的话,这个索引的区分度就非常低了。
- 按照我们前面说的方法,可能你需要创建长度为12以上的前缀索引,才能够满足区分度要求。
- 但是,索引选取的越长,占用的磁盘空间就越大,相同的数据页能放下的索引值就越少,搜索的效率也就会越低。
- 那么,如果我们能够确定业务需求里面只有按照身份证进行等值查询的需求,还有没有别的处理方法呢?这种方法,既可以占用更小的空间,也能达到相同的查询效率。现在简单的介绍一种解决此种问题的方式,当然方法肯定不止一种,如下:
倒序存储
如果你存储身份证号的时候把它倒过来存,每次查询的时候,你可以这么写:
select field_list from t where id_card = reverse('输入的身份证号');
由于身份证号的最后6位没有地址码这样的重复逻辑,所以最后这6位很可能就提供了足够的区分度。当然了,实践中你不要忘记使用
count(distinct)方法去做个验证。
前缀索引对覆盖索引的影响
- 前缀索引会导致覆盖索引失效,查询语句如下:
select id,name from user where email="chenmou1995@xxx";
- 由于使用了前缀索引,因此必须会回表验证查询到的时候正确,此处使用了覆盖索引也是无效的。
- 也就是说,使用前缀索引就用不上覆盖索引对查询性能的优化了,这也是你在选择是否使用前缀索引时需要考虑的一个因素。
总结
- 如何给字符串加索引是一个需要考量的问题,陈某在这里给出如下的建议:
- 如果字符串长度很短,建议直接用全部作为索引。
- 使用前缀索引注意分析区分度,区分度越高越好。
- 使用前缀索引需要考虑覆盖索引失效的问题。
理论要掌握,实操不能落!以上关于《Mysql性能优化:如何给字符串加索引?》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
499 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
101 收藏
-
475 收藏
-
483 收藏
-
462 收藏
-
469 收藏
-
289 收藏
-
239 收藏
-
315 收藏
-
361 收藏
-
184 收藏
-
227 收藏
-
202 收藏
-
140 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习