实现一个简单Database7
来源:SegmentFault
时间:2023-02-16 15:34:54 469浏览 收藏
对于一个数据库开发者来说,牢固扎实的基础是十分重要的,golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《实现一个简单Database7》,主要介绍了MySQL、数据库,希望对大家的知识积累有所帮助,快点收藏起来吧,否则需要时就找不到了!
- GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。
- GreatSQL是MySQL的国产分支版本,使用上与MySQL一致。
前文回顾
译注:cstsck在github维护了一个简单的、类似sqlite的数据库实现,通过这个简单的项目,可以很好的理解数据库是如何运行的。本文是第七篇,主要是对B-tree的介绍
Part 7 B-Tree简介
B-tree是SQLite用来表示表和索引的数据结构,所以B-tree是非常中心的想法。这个主题主要是介绍B-tree数据结构,所以不会有任何的代码。
为什么说对于数据库来说,树是非常好的数据结构呢?
- 查找特定的value很快(对数时间花销,loga N)
- 插入一行或者对查询到的数据删除很快(再平衡使用常量时间)
- 遍历一个范围内的value很快(不像hash map)
B-tree不同于二叉树(“B”可能代表发明人的名字,但也可以代表“Balanced”)。这里是一个B-tree例子:
B-Tree 例子(https://en.wikipedia.org/wiki...)
不像二叉树每个节点只能有两个子节点,B-tree的每个节点可以有两个以上的子节点。每个节点最多可以有 m 个子节点,其中 m 叫做树的“order”(或者叫“阶”)。为了保持树的尽量平衡,我们还要求节点必须至少有 m / 2 个子节点(四舍五入)。
但还有一些例外:
- 叶子节点没有子节点
- 根节点的子节点数可以少于 m,但至少要有两个
- 如果根节点也是叶子节点(树只有一个节点),那它有0个子节点
上面的描述的是一个B-tree,SQLite用它来存储索引。为了存储表数据,SQLites使用一种B-tree的变体,称为B+tree。
B-tree | B+ tree | |
---|---|---|
发音 | “Bee Tree” | “Bee Plus Tree” |
用来存储 | 索引 | 表 |
内部节点是否存储key | 是 | 是 |
内部节点是否存储value | 是 | 否 |
每个节点的子节点数 | 少 | 多 |
内部节点 vs 叶子节点 | 相同结构 | 不同结构 |
在我们开始实现索引之前,我将只讨论B+tree,但这里将其称为 B-tree 或者 btree。
有子节点(children)的节点被称为“内部”节点(internal node),内部节点和叶子节点在结构上不同:
m阶tree | 内部节点 | 叶子节点 |
---|---|---|
存储 | key和指向子节点的指针 | key和value |
key的数目 | 最多m-1个 | 越多越好 |
指针的数目 | keys + 1 | 无 |
value的数目 | 无 | 与key的数目相同 |
Key的用途 | 用来路由 | 与value成对存储 |
存储value? | 否 | 是 |
这里通过一个例子来看一下,当插入一个元素时,B-tree是怎样发生结构变化的。为了让事情看起来更容易理解,这棵B-tree的阶(order)设置为3(m=3),也就是说:
- 每个内部节点最多有三个子节点(m)
- 每个内部节点最多有两个key
- 每个内部节点至少两个子节点(m-1)
- 每个内部节点至少一个key
一棵空树只有一个节点:根节点。根节点最开始也作为叶子节点,有0个键值对(key/value):
空的btree
如果我们插入两个键值对(超过两个键值对,节点需要分裂,参考上面规则),他们会按顺序排序存放在叶子节点中。
一个节点的btree
我们假设了节点的容量是两个键值对儿。当我们插入另外一个的时候,就不得不分裂叶子节点了,分裂后的两个节点每个存放之前一半的键值对。分裂后的两个节点都变成了内部节点,同时也变成了一个新的节点的子节点,这个新的节点变成了根节点。
两层的btree
图中的内部节点(也是根节点)有一个key和两个指针指向子节点(就是那两条线)。如果我们想查找一个key,key小于或等于5,我们查看左子树。如果查找的key大于5,就查看右子树。
现在,准备插入一个新的key "2"。首先,我们查找它将位于哪个叶节点(如果它在树中存在的话),这样就到达了左侧叶子节点。这个节点是满的,所以把这个叶子节点进行分裂(split),并在父节点创建新的条目。
四节点的btree
现在继续增加key,18 和 21 。现在又到了不得不分裂的情况,但是在父节点中已经没有空间来增加新的键值对儿了。
内部节点没有空间
解决方法就是分裂根节点为两个内部节点,然后创建一个新的根节点作为两个内部节点的父节点。
三层的btree
树只是在我们分裂根节点的时候才会增加深度。每个叶子节点都有相同的深度和接近相同的数量的键值对儿,所以树能够保持平衡和快速的进行查找。
我暂时先不讨论从树中删除键的操作,推迟到实现插入操作以后。
当我们实现这个数据结构时,每个节点都对应一个page。根节点将在page0中存在。节点中的子节点指针将简单的使用包含子节点的page number。
下一次,我们开始实现btree。
Enjoy GreatSQL :)
## 关于 GreatSQL
GreatSQL是由万里数据库维护的MySQL分支,专注于提升MGR可靠性及性能,支持InnoDB并行查询特性,是适用于金融级应用的MySQL分支版本。
相关链接: GreatSQL社区 Gitee GitHub Bilibili
GreatSQL社区:
欢迎来GreatSQL社区发帖提问
https://greatsql.cn/
技术交流群:
微信:扫码添加GreatSQL社区助手微信好友,发送验证信息加群。
终于介绍完啦!小伙伴们,这篇关于《实现一个简单Database7》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布数据库相关知识,快来关注吧!
-
499 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
101 收藏
-
165 收藏
-
397 收藏
-
489 收藏
-
209 收藏
-
497 收藏
-
335 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习