【译】关系型数据库的工作原理
来源:SegmentFault
时间:2023-02-20 08:04:32 425浏览 收藏
本篇文章给大家分享《【译】关系型数据库的工作原理》,覆盖了数据库的常见基础知识,其实一个语言的全部知识点一篇文章是不可能说完的,但希望通过这些问题,让读者对自己的掌握程度有一定的认识(B 数),从而弥补自己的不足,更好的掌握它。
一、前言
在进行高性能 Java 持久性培训时,我意识到有必要解释关系数据库的工作原理,否则,很难掌握许多与事务相关的概念,例如原子性、持久性和检查点。
在这篇文章中,我将对关系数据库的内部工作方式进行高层次的解释,同时还暗示一些特定于数据库的实现细节。
二、一图胜千文
三、Data pages
磁盘访问速度很慢。另一方面,内存甚至比固态硬盘还要快几个数量级。出于这个原因,数据库供应商试图尽可能延迟磁盘访问。无论我们谈论的是表还是索引,数据都被分成一定大小(例如 8 KB)的 page。
当需要读取数据(表或索引)时,关系数据库会将基于磁盘的页面映射到内存缓冲区。当需要修改数据时,关系数据库会更改内存 pages。要将内存 pages 与磁盘同步,必须进行 flush(例如 fsync)。
存储基于磁盘的 page 的缓冲池大小有限,因此通常需要存储数据工作集。只有当整个数据可以放入内存时,缓冲池才能存储整个数据集。
但是,如果需要缓存新 page 时磁盘上的总体数据大于缓冲池大小,则缓冲池将不得不逐出旧 pages 为新 pages 腾出空间。
四、Undo log
因为内存中的变化可以被多个并发事务访问,所以必须采用并发控制机制(例如 2PL 和 MVCC)来确保数据完整性。因此,一旦事务修改了表行,未提交的更改将应用于内存结构,而先前的数据会临时存储在
undo logappend-only 结构中。
虽然这种结构在 Oracle 和 MySQL 中称为undo log,但在 SQL Server 中,事务日志起着这种作用。PostgreSQL 没有undo log,但是通过多版本表结构达到了相同的目的,因为表可以存储同一行的多个版本。然而,所有这些数据结构都用于提供回滚能力,这是原子性的强制性要求。
如果当前运行的事务回滚,undo log 将用于重建事务开始时的内存 pages。
五、Redo log
一旦事务提交,内存中的更改必须保持不变。但是,这并不意味着每个事务提交都会触发 fsync。事实上,这对应用程序性能非常不利。然而,从 ACID 事务属性,我们知道提交的事务必须提供持久性,这意味着即使我们拔掉数据库引擎,提交的更改也需要持久化。
那么,关系数据库如何提供持久性而不在每次事务提交时发出 fsync 呢?
这就是
redo log发挥作用的地方。
redo log也是一种 append-only 基于磁盘的结构,用于存储给定事务所经历的每个更改。因此,当事务提交时,每个数据页更改也将写入_redo log_。与刷新固定数量的
data pages相比,写入
redo log非常快,因为顺序磁盘访问比 Random access 快得多。因此,它还允许事务快速处理。
虽然这种结构在 Oracle 和 MySQL 中被称为redo log,但在 SQL Server 中,事务日志也扮演着这个角色。PostgreSQL 将其称为预写日志 (WAL)。
但是,何时将内存中的更改 flush 到磁盘?
关系数据库系统使用检查点将内存中的脏 pages 与其基于磁盘的对应物同步。为避免 IO 流量拥塞,同步通常在较长的时间段内分块完成。
但是,如果关系数据库在将所有脏内存 pages 刷新到磁盘之前崩溃会发生什么?
万一发生崩溃,在启动时,数据库将使用 redo log 重建自上次成功检查点以来未同步的基于磁盘的 data pages。
六、结论
采用这些设计考虑是为了克服基于磁盘的存储的高延迟,同时仍然提供持久性存储保证。因此,需要 undo log 来提供原子性(回滚能力),而需要 redo log 来确保基于磁盘的 page(表和索引)的持久性。
七、译者说:
大家好,我是 如梦技术春哥(mica 开源作者)翻译不易,请帮忙分享给更多的同学,谢谢!!!
今天关于《【译】关系型数据库的工作原理》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!
-
499 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
101 收藏
-
208 收藏
-
174 收藏
-
317 收藏
-
371 收藏
-
244 收藏
-
288 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习
-
- 顺利的板凳
- 这篇技术贴太及时了,博主加油!
- 2023-05-27 09:03:56
-
- 活力的小懒猪
- 这篇技术文章真及时,太细致了,赞 👍👍,收藏了,关注博主了!希望博主能多写数据库相关的文章。
- 2023-05-23 17:49:05
-
- 高高的电源
- 这篇技术文章出现的刚刚好,太细致了,很有用,mark,关注博主了!希望博主能多写数据库相关的文章。
- 2023-05-12 02:36:12
-
- 热情的吐司
- 太详细了,mark,感谢大佬的这篇技术文章,我会继续支持!
- 2023-04-10 15:06:17
-
- 精明的龙猫
- 这篇技术贴真是及时雨啊,大佬加油!
- 2023-04-08 09:08:17
-
- 负责的蓝天
- 很详细,码住,感谢楼主的这篇技术文章,我会继续支持!
- 2023-03-27 23:26:31
-
- 英俊的海燕
- 感谢大佬分享,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢作者大大分享技术贴!
- 2023-03-03 14:35:12
-
- 细心的棒球
- 太给力了,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢作者大大分享技术贴!
- 2023-02-25 01:32:21