技术分享 | MySQL 组复制数据一致性管理解析
来源:SegmentFault
时间:2023-02-25 10:14:07 123浏览 收藏
大家好,今天本人给大家带来文章《技术分享 | MySQL 组复制数据一致性管理解析》,文中内容主要涉及到MySQL,如果你对数据库方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!
作者:杨涛涛
资深数据库专家,专研 MySQL 十余年。擅长 MySQL、PostgreSQL、MongoDB 等开源数据库相关的备份恢复、SQL 调优、监控运维、高可用架构设计等。目前任职于爱可生,为各大运营商及银行金融企业提供 MySQL 相关技术支持、MySQL 相关课程培训等工作。
本文来源:原创投稿
*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。
MySQL 组复制数据的一致性管理解析
来源于客户的一个问题。客户对组复制的数据一致性保障机制非常困惑,一直不太明白,其实就是对组复制参数
MySQL debian-ytt1:3306 ssl ytt Py > c1 = dba.get_cluster('ytt_mgr'); MySQL debian-ytt1:3306 ssl ytt Py > c1.status(); { "clusterName": "ytt_mgr", "defaultReplicaSet": { "name": "default", "primary": "debian-ytt1:3306", "ssl": "REQUIRED", "status": "OK", "statusText": "Cluster is ONLINE and can tolerate up to ONE failure.", "topology": { "debian-ytt1:3306": { "address": "debian-ytt1:3306", "mode": "R/W", "readReplicas": {}, "replicationLag": null, "role": "HA", "status": "ONLINE", "version": "8.0.20" }, "debian-ytt2:3306": { "address": "debian-ytt2:3306", "mode": "R/O", "readReplicas": {}, "replicationLag": null, "role": "HA", "status": "ONLINE", "version": "8.0.20" }, "debian-ytt3:3306": { "address": "debian-ytt3:3306", "mode": "R/O", "readReplicas": {}, "replicationLag": null, "role": "HA", "status": "ONLINE", "version": "8.0.20" } }, "topologyMode": "Single-Primary" }, "groupInformationSourceMember": "debian-ytt1:3306" }
三、三种选项值的含义和适用场景
3.1 EVENTUAL
这类选项代表最终一致性,组复制默认值。意思是说,设置了 EVENTUAL 的节点,其读或者写请求可以立即返回结果,不用等到新请求之前的中继日志处理完。
创建一张测试表 t1。
create table t1 (id serial primary key, r1 int,r2 int,r3 char(36)); Query OK, 0 rows affected (0.07 sec)
节点 1 正常插入一条记录。
insert into t1 (r1,r2,r3) select 10,20,uuid(); Query OK, 1 row affected (0.02 sec) Records: 1 Duplicates: 0 Warnings: 0
节点 2 及时应用这条记录到表 t1。
select * from t1; +----+------+------+--------------------------------------+ | id | r1 | r2 | r3 | +----+------+------+--------------------------------------+ | 1 | 10 | 20 | e878289e-89c4-11ea-861d-08002753f58d | +----+------+------+--------------------------------------+ 1 row in set (0.00 sec)
此时给节点 2 加一个 server 层的共享读锁,人为制造拥堵延迟。
lock table t1 read; Query OK, 0 rows affected (0.00 sec)
节点 1 再次插入一条 ID 为 2 的新记录。
insert into t1 (r1,r2,r3) select 20,20,uuid(); Query OK, 1 row affected (0.02 sec) Records: 1 Duplicates: 0 Warnings: 0 select * from t1; +----+------+------+--------------------------------------+ | id | r1 | r2 | r3 | +----+------+------+--------------------------------------+ | 1 | 10 | 20 | e878289e-89c4-11ea-861d-08002753f58d | | 2 | 20 | 20 | 2982d33f-89c5-11ea-861d-08002753f58d | +----+------+------+--------------------------------------+ 2 rows in set (0.00 sec)
此时再次查询节点 2 可立即返回结果,但是数据并非最新,不包含最新 ID 为 2 的记录,还是之前的旧数据。
select * from t1; +----+------+------+--------------------------------------+ | id | r1 | r2 | r3 | +----+------+------+--------------------------------------+ | 1 | 10 | 20 | e878289e-89c4-11ea-861d-08002753f58d | +----+------+------+--------------------------------------+ 1 row in set (0.00 sec)
节点 2 上,ID 为 2 的这条记录,目前状态为:已拉到自己的中继日志,但尚未应用到表 t1。表 t1 的共享读锁释放掉后,才能继续应用。现在释放表 t1 的共享读锁,再次查询已经包含最新的记录。
unlock tables; Query OK, 0 rows affected (0.01 sec) select * from t1; +----+------+------+--------------------------------------+ | id | r1 | r2 | r3 | +----+------+------+--------------------------------------+ | 1 | 10 | 20 | e878289e-89c4-11ea-861d-08002753f58d | | 3 | 20 | 20 | 759cc5c0-89c7-11ea-861d-08002753f58d | +----+------+------+--------------------------------------+
从以上例子可以看出,最终一致性模式优缺点。
- 优点:可以快速返回本节点已经成功应用的数据,不用等待所有的数据应用完成。
- 缺点:可能返回的数据比较旧。
3.2 BEFORE
这类选项代表保证本地节点强一致性。也就是说设置为此选项的本地节点必须要等待中继日志数据全部应用完成后,才会执行新的请求,否则会一直等待。等待的时间和中继日志里未应用的事务量成一定比率。
为了清晰起见,清空表 t1 数据。
truncate t1; Query OK, 0 rows affected (0.17 sec)
新启一个连接到节点 2,给表 t1 上共享读锁,对应的 SESSION ID =1。
lock table t1 read; Query OK, 0 rows affected (0.01 sec)
在节点 1 上插入一条新记录。
insert into t1 select 1,1,1,uuid(); Query OK, 1 row affected (0.02 sec) Records: 1 Duplicates: 0 Warnings: 0
另外开启一个新连接到节点 2,对应的 SESSION ID = 2。设置参数 group_replication_consistency=before,完了立刻查询表 t1 数据,处于等待状态。
set @@group_replication_consistency='before'; Query OK, 0 rows affected (0.00 sec) select * from t1; # 此处 HANG 住!
在节点 3 上查询表 t1 数据,立刻返回刚才插入的记录,也就是说对节点 3 没有影响。
select * from t1; +----+------+------+--------------------------------------+ | id | r1 | r2 | r3 | +----+------+------+--------------------------------------+ | 1 | 1 | 1 | ee83837e-89ce-11ea-861d-08002753f58d | +----+------+------+--------------------------------------+ 1 row in set (0.00 sec)
此时切换到节点 2 的 SESSION ID = 1 的会话,解锁表 t1。
unlock tables; Query OK, 0 rows affected (0.00 sec)
再次查看节点 2 的 SESSION ID = 2 的会话,结果已经返回,时间为 3 分 17 秒。相比 EVENTUAL,并不是立即返回结果。
select * from t1; +----+------+------+--------------------------------------+ | id | r1 | r2 | r3 | +----+------+------+--------------------------------------+ | 1 | 1 | 1 | ee83837e-89ce-11ea-861d-08002753f58d | +----+------+------+--------------------------------------+ 1 row in set (3 min 17.51 sec)
可以看出,BEFORE 模式优先保证了本地节点永远读取到最新的数据。最大的缺点是必须煎熬等待本地节点中继日志里未应用的数据正常应用。如果日志里有很多写的不好的事务块或者大事务,则会造成本节点很大的延迟。
3.3 AFTER
这类选项代表全局强一致性。设置为此模式的节点,必须等待集群内其他所有其他节点应用完自己中继日志里的事务,才能返回结果。
把节点 1 参数
truncate t1; Query OK, 0 rows affected (0.22 sec) set @@group_replication_consistency='after'; Query OK, 0 rows affected (0.00 sec)
在节点 2 上,给表 t1 加共享读锁。
lock table t1 read; Query OK, 0 rows affected (0.01 sec)
之后在节点 1 插入一条记录,并没有立即返回,处于等待状态,因为节点 2 上的表 t1 被锁了,节点 2 的日志要成功应用必须要等表 t1 解锁才可以。
insert into t1 select 1,1,1,uuid(); # 处于等待状态
此时回到节点 2,由于模式默认,立即返回结果,不过数据很旧。
select * from t1; Empty set (0.00 sec)
此时在节点 3 上对表 t1 进行查询,发现这个请求也处于等待状态。也就是说虽然节点 3 也是默认模式,但是由于主节点设置为 AFTER,节点 3 也必须等待其他的从节点日志应用完毕后才能返回结果。
select * from t1;
现在在节点 2 上解锁表 t1,再次回到节点 1 上的 ID 为 121 的连接,结果已经返回,不过花费了 6 分 47 秒。
insert into t1 select 1,1,1,uuid(); Query OK, 1 row affected (6 min 47.14 sec) Records: 1 Duplicates: 0 Warnings: 0
此时在节点 3 上检查之前的查询,结果也已经返回。
select * from t1; +----+------+------+--------------------------------------+ | id | r1 | r2 | r3 | +----+------+------+--------------------------------------+ | 1 | 1 | 1 | 49430687-89e9-11ea-861d-08002753f58d | +----+------+------+--------------------------------------+ 1 row in set (18.25 sec)
从以上过程可以看到,AFTER 是一个强同步的选项。优先保证了集群内所有节点的数据一致性,但是也带来一个很大的性能问题:集群对外总的事务提交时间依赖于组内最慢的那个节点。如果最慢的节点遇到故障,那其他节点就必须等待超时回滚了。
总结
本文对组复制的数据一致性级别参数值的设置做了详细的演示。可以看到我只说明了前三个选项,后面两个由于基于前三个选项的组合,这里没有单独说明,感兴趣可以自己实验下。
今天关于《技术分享 | MySQL 组复制数据一致性管理解析》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于mysql的内容请关注golang学习网公众号!
-
499 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
101 收藏
-
259 收藏
-
411 收藏
-
476 收藏
-
312 收藏
-
244 收藏
-
195 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习