登录
首页 >  数据库 >  MySQL

为什么mysql索引选择b+树作为底层存储结构?

来源:SegmentFault

时间:2023-02-18 10:01:29 339浏览 收藏

小伙伴们有没有觉得学习数据库很有意思?有意思就对了!今天就给大家带来《为什么mysql索引选择b+树作为底层存储结构?》,以下内容将会涉及到MySQL,若是在学习中对其中部分知识点有疑问,或许看了本文就能帮到你!

博客搬家啦,更多干活 https://blog.csdn.net/qq_2816...

这篇文章解决一个问题

mysql 底层为什么是用b+树作为存储结构?为什么不是二叉树,红黑树,b树?

我们先构造一个应用场景,我们有1kw的数据需要存储在一张表里面,那么我们怎么设计能让查询速度尽可能的快

我们实验的可视化的数据结构皆从以下网站获取,地址:https://www.cs.usfca.edu/~gal...

image.png

ok,我们先来看下二叉树怎么存储这1kw数据,假设我有一张表,这张表里只有一个字段,他是递增的,看看用二叉树是什么情形

b_in.2020-02-03 13_00_50.gif

于是,我们看到,在这种情况下二叉树直接退化成了一个链表,我们如果要找到5这个记录,需要查找5次,n条数据就要查找n次,复杂度O(n), 不满足我们的需求

我们再来看看红黑树

WX20200203-132708@2x.png

我们看到红黑树有一个自平衡的特性,以牺牲插入性能解决了退化成链表的问题,但随着记录树的增加,树的高度会不断增加,那么,我们想找到第1kw个数据,依然要查找很多次,对应到mysql上每次读取一个树的节点都需要进行一次io,那么还有没有更好的办法呢?

ok,接下来看看b树

WX20200203-133550@2x.png

可以明显看到的区别是,每一个节点上存储了多个数据,其实逻辑很简单嘛,想保证高度固定,那就横向上想办法,这样的话我们查找16这条记录,其实只需要经过3次io就可以了

b_find.2020-02-03 13_40_12.gif

那b+树和b树又有什么区别呢?引用网上的一张图说明一下

image.png

具体到mysql上就是

  1. 有冗余索引,方便查找
  2. 只在叶子节点上存储数据,16k(mysql innodb_page_size的默认大小)的内存可以存下更多数据,降低高度,查询更快
  3. 叶子节点增加了双向链表,方便范围查询

于是,我们就明白了,为什么mysql要用b+树作为底层数据结构,1kw的数据,索引应用合理,可能3次或者4次io就可以定位到记录了。

今天带大家了解了MySQL的相关知识,希望对你有所帮助;关于数据库的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

声明:本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
评论列表