技术分享 | 使用备份恢复实例时存在的坑
来源:SegmentFault
时间:2023-02-17 14:43:19 408浏览 收藏
大家好,今天本人给大家带来文章《技术分享 | 使用备份恢复实例时存在的坑》,文中内容主要涉及到MySQL,如果你对数据库方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!
作者:林靖华
爱可生服务团队成员,负责处理客户在MySQL日常运维中遇到的问题;擅长处理备份相关的问题,对数据库相关技术有浓厚的兴趣,喜欢钻研各种问题。
本文来源:原创投稿
*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。
实验
环境准备
ip | role | server_id | server_uuid | log_slave_updates | version |
---|---|---|---|---|---|
192.168.13.131 | master | 1 | eefac7d8-2370-11e9-bfeb-000c29d74445 | on | 5.7.29 |
192.168.13.132 | slave | 2 | b66b4623-207d-11ea-a993-000c29122c12 | on | 5.7.29 |
步骤
1、主从同步验证
先在主库写入一些数据,然后验证数据已经同步到从库
-- master(131) mysql> create database test1; Query OK, 1 row affected (0.00 sec) mysql> create database test2; Query OK, 1 row affected (0.01 sec) mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | mysql | | performance_schema | | sys | | test1 | | test2 | +--------------------+ 6 rows in set (0.00 sec) mysql> show master status; +------------------+----------+--------------+------------------+------------------------------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +------------------+----------+--------------+------------------+------------------------------------------+ | mysql-bin.000001 | 478 | | | eefac7d8-2370-11e9-bfeb-000c29d74445:1-2 | +------------------+----------+--------------+------------------+------------------------------------------+ 1 row in set (0.00 sec) -- slave(132) mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | mysql | | performance_schema | | sys | | test1 | | test2 | +--------------------+ 6 rows in set (0.00 sec) mysql> show slave status\G; *************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 192.168.13.131 Master_User: repl Master_Port: 3306 Connect_Retry: 60 Master_Log_File: mysql-bin.000001 Read_Master_Log_Pos: 478 Relay_Log_File: 192-168-13-132-relay-bin.000002 Relay_Log_Pos: 691 Relay_Master_Log_File: mysql-bin.000001 Slave_IO_Running: Yes Slave_SQL_Running: Yes ...... Retrieved_Gtid_Set: eefac7d8-2370-11e9-bfeb-000c29d74445:1-2 Executed_Gtid_Set: eefac7d8-2370-11e9-bfeb-000c29d74445:1-2
2、 在从库上创建备份
逻辑备份或物理备份都可以,这里以逻辑备份为例
mysqldump -uroot -p123456 --single-transaction --master-data=2 --all-databases > dump.sql
3、向主库写入数据
-- master(131) mysql> create database test3; Query OK, 1 row affected (0.00 sec) mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | mysql | | performance_schema | | sys | | test1 | | test2 | | test3 | +--------------------+ 7 rows in set (0.01 sec) mysql> show master status; +------------------+----------+--------------+------------------+------------------------------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +------------------+----------+--------------+------------------+------------------------------------------+ | mysql-bin.000001 | 640 | | | eefac7d8-2370-11e9-bfeb-000c29d74445:1-3 | +------------------+----------+--------------+------------------+------------------------------------------+ 1 row in set (0.00 sec) -- slave(132) mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | mysql | | performance_schema | | sys | | test1 | | test2 | | test3 | +--------------------+ 7 rows in set (0.00 sec) mysql> show slave status\G; *************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 192.168.13.131 Master_User: repl Master_Port: 3306 Connect_Retry: 60 Master_Log_File: mysql-bin.000001 Read_Master_Log_Pos: 640 Relay_Log_File: 192-168-13-132-relay-bin.000002 Relay_Log_Pos: 853 Relay_Master_Log_File: mysql-bin.000001 Slave_IO_Running: Yes Slave_SQL_Running: Yes ...... Retrieved_Gtid_Set: eefac7d8-2370-11e9-bfeb-000c29d74445:1-3 Executed_Gtid_Set: eefac7d8-2370-11e9-bfeb-000c29d74445:1-3
4、产生故障
假设现在主库存放数据的磁盘发生故障,HA 将原来的从节点提升为主节点来提供数据的写入,然后插入数据
-- new master(132) mysql> create database test4; Query OK, 1 row affected (0.01 sec) mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | mysql | | performance_schema | | sys | | test1 | | test2 | | test3 | | test4 | +--------------------+ 8 rows in set (0.00 sec) mysql> show master status; +------------------+----------+--------------+------------------+----------------------------------------------------------------------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +------------------+----------+--------------+------------------+----------------------------------------------------------------------------------+ | mysql-bin.000001 | 802 | | | b66b4623-207d-11ea-a993-000c29122c12:1, eefac7d8-2370-11e9-bfeb-000c29d74445:1-3 | +------------------+----------+--------------+------------------+----------------------------------------------------------------------------------+ 1 row in set (0.00 sec)
5、恢复实例
用之前备份的数据来恢复挂掉的实例
-- old master(131) mysql -uroot -p123456
恢复后拥有的数据
mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | mysql | | performance_schema | | sys | | test1 | | test2 | +--------------------+ 6 rows in set (0.00 sec) mysql> show master status; +------------------+----------+--------------+------------------+------------------------------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +------------------+----------+--------------+------------------+------------------------------------------+ | mysql-bin.000001 | 478 | | | eefac7d8-2370-11e9-bfeb-000c29d74445:1-2 | +------------------+----------+--------------+------------------+------------------------------------------+ 1 row in set (0.00 sec)
6、与新主建立复制关系
-- old master(131) mysql> change master to -> master_host='192.168.13.132', -> master_user='repl', -> master_password='123456', -> master_auto_position=1; Query OK, 0 rows affected, 2 warnings (0.01 sec) mysql> start slave; Query OK, 0 rows affected (0.00 sec) mysql> show databases; +--------------------+ | Database | +--------------------+ | information_schema | | mysql | | performance_schema | | sys | | test1 | | test2 | | test4 | +--------------------+ 7 rows in set (0.00 sec) mysql> show master status; +------------------+----------+--------------+------------------+----------------------------------------------------------------------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +------------------+----------+--------------+------------------+----------------------------------------------------------------------------------+ | mysql-bin.000001 | 640 | | | b66b4623-207d-11ea-a993-000c29122c12:1, eefac7d8-2370-11e9-bfeb-000c29d74445:1-2 | +------------------+----------+--------------+------------------+----------------------------------------------------------------------------------+ 1 row in set (0.00 sec)
现象
可以观察到,在旧主通过备份恢复数据且加回到集群后,丢失了部分的数据。操作的步骤看起来并没有问题,那么原因是什么呢?
丢失的事务的 GTID 是
#200220 14:19:41 server id 1 end_log_pos 543 CRC32 0x3fa9fb8c GTID last_committed=2 sequence_number=3 rbr_only=no SET @@SESSION.GTID_NEXT= 'eefac7d8-2370-11e9-bfeb-000c29d74445:3'/*!*/; # at 543 #200220 14:19:41 server id 1 end_log_pos 640 CRC32 0x8427b0a3 Query thread_id=4 exec_time=0 error_code=0 SET TIMESTAMP=1582179581/*!*/; create database test3 /*!*/;
新主的 binlog 中是有这个事务的,那接着我们再来看下旧主的 relaylog 中是否也同样记录。但意外的是,relaylog 中并没有相关的记录,说明这个事务根本没有写进 relaylog。
那么我们可以回想一下,在 MySQL 里面,有没有类似的机制或者参数让主库的 binlog 在传输或写入从库的过程中被过滤掉。正好我们发现,开启 binlog 必须要配置的 server_id 就能起到这样的作用。
分析
由于我们在恢复实例的时候使用的备份集不是最新的备份集,这个备份集中只含有
eefac7d8-2370-11e9-bfeb-000c29d74445:1-2两个事务,那么恢复回来的实例加入集群变成从实例的时候,需要通过新主库的 binlog 来补偿数据。
在传输事务
eefac7d8-2370-11e9-bfeb-000c29d74445:3的时候,从实例的 io_thread 发现这个事务记录的 server_id 为 1,与自己的 server_id 一致,会认为这个是自己执行过的事务,就会把这段信息给过滤掉,最终这个从实例的数据就会缺少一部分。
总结
由此可见,在这种情况下,更换 server_id 是最简单的解决办法,所以我们在恢复实例的时候,尽可能的去修改 server_id,保证 server_id 不与之前的重复且与集群中的其他实例不相同。
有不少人并没有碰到类似的问题,是因为他们在恢复实例的时候,通常是直接在线备份线上的实例,用最新的备份集来导入数据,在这种情况下,也可以避免以上问题的发生。
另外还有一个值得一提的参数
--replicate-same-server-id,这个参数的作用是开启后即使 io_thread 收到与自己 server_id 相同的 binlog,也会写入 relaylog。虽然启用这个参数也可以避免以上问题,但在大部分情况下都不推荐开启这个参数,默认值 OFF 是为了避免 binlog 在复制中回环。在 5.7 中想开启这个参数的话需要先关闭
log_slave_updates;8.0 则做了改进,当
gtid_mode=ON的情况下就可以开启。
参考:
https://lefred.be/content/mys...
https://www.zhangshengrong.co...
https://dev.mysql.com/doc/ref...
理论要掌握,实操不能落!以上关于《技术分享 | 使用备份恢复实例时存在的坑》的详细介绍,大家都掌握了吧!如果想要继续提升自己的能力,那么就来关注golang学习网公众号吧!
-
499 收藏
-
384 收藏
-
184 收藏
-
265 收藏
-
352 收藏
-
223 收藏
-
334 收藏
-
224 收藏
-
275 收藏
-
372 收藏
-
463 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习
-
- 无聊的硬币
- 很详细,已加入收藏夹了,感谢up主的这篇文章内容,我会继续支持!
- 2023-04-19 18:46:54
-
- 饱满的诺言
- 这篇技术贴太及时了,细节满满,很棒,已收藏,关注作者大大了!希望作者大大能多写数据库相关的文章。
- 2023-04-13 17:22:48
-
- 单身的音响
- 很好,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢作者大大分享技术贴!
- 2023-04-03 20:20:03
-
- 炙热的河马
- 这篇技术文章真及时,细节满满,很好,已收藏,关注楼主了!希望楼主能多写数据库相关的文章。
- 2023-03-15 16:24:25
-
- 雪白的水蜜桃
- 这篇技术文章真是及时雨啊,太详细了,真优秀,已收藏,关注up主了!希望up主能多写数据库相关的文章。
- 2023-02-27 18:34:53