mysql MVCC事务实现原理
来源:SegmentFault
时间:2023-01-11 16:17:35 187浏览 收藏
来到golang学习网的大家,相信都是编程学习爱好者,希望在这里学习数据库相关编程知识。下面本篇文章就来带大家聊聊《mysql MVCC事务实现原理》,介绍一下MySQL、Redis、数据库、NoSQL,希望对大家的知识积累有所帮助,助力实战开发!
大家知道MySQL中的事务是基于MVCC版本链实现的,但是MySQL对于我们来说是一个黑盒,对于底层的实现了解的不是很多。本文主要介绍MySQL中的InnoDB引擎的MVCC的实现原理,由浅到深带领大家从根上理解MySQL
InnoDB行格式
InnoDB存储引擎中记录是以行的形式存储的,这就意味着数据页(page)中保存的是一行行的数据,我们把记录在磁盘上的存放方式被称为行格式或者记录格式。到目前为止设计了4种不同类型的行格式,分别为Compact、Redundant、Dynamic和Compressed。本文只简单的介绍Compact行格式(其他的行格式大同小异,暂不做介绍)。可以通过下列命令修改、查看行格式
## 创建表设置行格式 CREATE TABLE 表名 (列的信息) ROW_FORMAT=行格式名称 ## 修改行格式 ALTER TABLE 表名 ROW_FORMAT=行格式名称 ##查看表行格式 SHOW TABLE STATUS LIKE "表名"
COMPACT行格式
上图为compact行格式的结构示意图,其中跟事务(MVCC)有关联的是隐藏列的内容
变长字段长度列表
mysql支持一些变长字段类型比如:VARCHAR、TEXT、BLOB等。变长字段中存储多少字节的数据是不固定的,所以我们在存储真实数据的时候需要顺便把这些数据占用的字节数也存起来。
null值列表
表中的某些列可能存储NULL值,如果把这些NULL值都放到记录的真实数据中存储会很占地方,所以Compact行格式把这些值为NULL的列统一管理起来,存储到NULL值列表
记录头信息
隐藏列
名称 | 描述 |
---|---|
row_id | 列id(如果表没有指定主键,该列为隐藏主键) |
trx_id | 事务id |
roll_pointer | 回滚指针、指向undo日志 |
SQL标准中的四种隔离级别
- READ UNCOMMITTED:未提交读。
- READ COMMITTED:已提交读。
- REPEATABLE READ:可重复读。
- SERIALIZABLE:可串行化。
事务隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
READ UNCOMMITTED | 是 | 是 | 是 |
READ COMMITTED | 否 | 是 | 是 |
REPEATABLE READ | 否 | 否 | 是 |
SERIALIZABLE | 否 | 否 | 否 |
MVCC原理
版本链
上面介绍过行格式中有个隐藏的列(row_id,trx_id,roll_pointer),其中row_id不是必须的。
- trx_id:每次一个事务对某条聚簇索引记录进行改动时,都会把该事务的事务id赋值给trx_id隐藏列。
- roll_pointer:每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息。
备注:事务执行过程中,只有在第一次真正修改记录时(比如使用INSERT、DELETE、UPDATE语句),才会被分配一个单独的事务id,这个事务id是递增的
当前有个hero的表,查询结果下图:
假设插入该记录的事务id为80,那么此刻该条记录的示意图如下所示
之后两个事务id分别为100、200的事务对这条记录进行UPDATE操作,操作流程如下:
事务trx_id 100 | 事务trx_id 200 |
---|---|
begin | |
begin | |
UPDATE hero set name="关羽" | |
UPDATE hero set name="张飞" | |
commit | |
UPDATE hero set name="赵云" | |
UPDATE hero set name="诸葛亮" | |
commit |
此时的版本链就如下图所示,可以看到记录的修改组成了一个链表,链表中每个节点都记录了当前记录的事务id(trx_id),MVCC也是基于这些链表去实现的事务级别的4种隔离级别,也就是下面介绍的ReadView。
ReadView
对于使用READ UNCOMMITTED隔离级别的事务来说,由于可以读到未提交事务修改过的记录,所以直接读取记录的最新版本就好了;对于使用SERIALIZABLE隔离级别的事务来说,规定使用加锁的方式来访问记录;对于使用READ COMMITTED和REPEATABLE READ隔离级别的事务来说,都必须保证读到已经提交了的事务修改过的记录,也就是说假如另一个事务已经修改了记录但是尚未提交,是不能直接读取最新版本的记录的,核心问题就是:需要判断一下版本链中的哪个版本是当前事务可见的。为此mysql设计出了ReadView的概念,ReadView中有4个比较重要的属性:
- m_ids:表示在生成ReadView时当前系统中活跃的读写事务的事务id列表。
- min_trx_id:表示在生成ReadView时当前系统中活跃的读写事务中最小的事务id,也就是m_ids中的最小值。
- max_trx_id:表示生成ReadView时系统中应该分配给下一个事务的id值。
- creator_trx_id:表示生成该ReadView的事务的事务id。
有了这个ReadView,这样在访问某条记录时,只需要按照下边的步骤判断记录的某个版本是否可见:
- 如果被访问版本的trx_id属性值与ReadView中的creator_trx_id值相同,意味着当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问。
- 如果被访问版本的trx_id属性值小于ReadView中的min_trx_id值,表明生成该版本的事务在当前事务生成ReadView前已经提交,所以该版本可以被当前事务访问。
- 如果被访问版本的trx_id属性值大于或等于ReadView中的max_trx_id值,表明生成该版本的事务在当前事务生成ReadView后才开启,所以该版本不可以被当前事务访问。
- 如果被访问版本的trx_id属性值在ReadView的min_trx_id和max_trx_id之间,那就需要判断一下trx_id属性值是不是在m_ids列表中,如果在,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问;如果不在,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问。
基于上面的ReadView的规则,READ COMMITTED和REPEATABLE READ有什么不同呢?
READ COMMITTED —— 每次读取数据前都生成一个ReadView
REPEATABLE READ —— 在第一次读取数据时生成一个ReadView
参考资料:
终于介绍完啦!小伙伴们,这篇关于《mysql MVCC事务实现原理》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布数据库相关知识,快来关注吧!
-
499 收藏
-
286 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
184 收藏
-
237 收藏
-
210 收藏
-
192 收藏
-
364 收藏
-
373 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习