技术分享 | mysql 表数据校验
来源:SegmentFault
时间:2023-01-21 13:58:56 148浏览 收藏
怎么入门数据库编程?需要学习哪些知识点?这是新手们刚接触编程时常见的问题;下面golang学习网就来给大家整理分享一些知识点,希望能够给初学者一些帮助。本篇文章就来介绍《技术分享 | mysql 表数据校验》,涉及到MySQL、数据库,有需要的可以收藏一下
作者:杨涛涛来源于客户的问题:数据库校验的方法有哪些,能否给他说说?
我:直接 percona toolkit 不就行了。
客户:服务器装任何软件都得评审,评审一次多长时间不定。而且不准用开源软件。
我:...好了,来看下 MySQL 自身怎么对数据进行校验。
1.checksum table.
checksum table 会对表一行一行进行计算,直到计算出最终的 checksum 结果。
比如对表 n4 进行校验(记录数 157W,大小为 4G)
[ytt]>desc n4; +-------+--------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+--------------+------+-----+---------+-------+ | id | int(11) | YES | | NULL | | | r1 | char(36) | YES | | NULL | | | r2 | varchar(100) | YES | | NULL | | | r3 | datetime | YES | | NULL | | | r4 | text | YES | | NULL | | +-------+--------------+------+-----+---------+-------+ 5 rows in set (0.00 sec) [ytt]>select count(*) from n4; +----------+ | count(*) | +----------+ | 1572864 | +----------+ 1 row in set (6.89 sec) [ytt]>checksum table n4; +--------+-----------+ | Table | Checksum | +--------+-----------+ | ytt.n4 | 874125175 | +--------+-----------+ 1 row in set (8.24 sec)
我自己笔记本上的测试结果,速度挺快。
不过checksum的限制比较多。罗列如下,
A、不能对视图进行校验。
[ytt]>checksum table v_n3; +----------+----------+ | Table | Checksum | +----------+----------+ | ytt.v_n3 | NULL | +----------+----------+ 1 row in set, 1 warning (0.00 sec) [ytt]>show warnings; +-------+------+------------------------------+ | Level | Code | Message | +-------+------+------------------------------+ | Error | 1347 | 'ytt.v_n3' is not BASE TABLE | +-------+------+------------------------------+ 1 row in set (0.00 sec)
B、字段顺序不同,校验结果也会不一致。
[ytt]>desc n3; +-------+---------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+---------+------+-----+---------+-------+ | id | int(11) | NO | | NULL | | | r1 | int(11) | YES | | NULL | | +-------+---------+------+-----+---------+-------+ 2 rows in set (0.00 sec) [ytt]>desc n5; +-------+---------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+---------+------+-----+---------+-------+ | r1 | int(11) | YES | | NULL | | | id | int(11) | NO | | NULL | | +-------+---------+------+-----+---------+-------+ 2 rows in set (0.00 sec) [ytt]>checksum table n3,n5; +--------+------------+ | Table | Checksum | +--------+------------+ | ytt.n3 | 1795175396 | | ytt.n5 | 838415794 | +--------+------------+ 2 rows in set (0.00 sec)
C、CHAR(100) 和 VARCHAR(100) 存储相同的字符,校验结果也会不一致。
[ytt]>desc n6; +-------+--------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+--------------+------+-----+---------+-------+ | id | int(11) | NO | | NULL | | | r1 | int(11) | YES | | NULL | | | s1 | varchar(100) | YES | | NULL | | +-------+--------------+------+-----+---------+-------+ 3 rows in set (0.00 sec) [ytt]>desc n3; +-------+-----------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+-----------+------+-----+---------+-------+ | id | int(11) | NO | | NULL | | | r1 | int(11) | YES | | NULL | | | s1 | char(100) | YES | | NULL | | +-------+-----------+------+-----+---------+-------+ 3 rows in set (0.00 sec) [ytt]>select * from n6; Empty set (0.00 sec) [ytt]>insert into n6 select * from n3; Query OK, 8 rows affected (0.01 sec) Records: 8 Duplicates: 0 Warnings: 0 [ytt]>checksum table n3,n6; +--------+------------+ | Table | Checksum | +--------+------------+ | ytt.n3 | 2202684200 | | ytt.n6 | 455222236 | +--------+------------+ 2 rows in set (0.00 sec)
D、在执行 checksum 同时,会对表所有行加共享读锁。
E、还有就是 MySQL 版本不同,有可能校验结果不一致。比如手册上说的, MySQL 5.6.5 之后的版本对时间类型的存储格式有变化,导致校验结果不一致。
那 checksum 的 限制这么多,我们是不是有其方法来突破所有限制呢? 比如说可以模拟 checksum table 的原理来手工计算。
2.自己计算 checksum 值。
这里用了 MySQL 自身的几个特性:session 变量;通用表达式;窗口函数以及 MySQL 的 concat_ws 函数。实现非常简单。
比如我们用 sha 函数来计算校验值。
[ytt]>set @crc=''; Query OK, 0 rows affected (0.00 sec) [ytt]> [ytt]>with ytt (r,rn) as -> ( -> select @crc:= sha(concat_ws('#',@crc,id,r1,r2,r3,r4)) as r, row_number() over() as rn -> from n4 -> ) -> select 'n4' tablename, r checksum from ytt where rn = 1572864 ; +-----------+------------------------------------------+ | tablename | checksum | +-----------+------------------------------------------+ | n4 | a9711af93399e0d195a53f4148adea46ab684d30 | +-----------+------------------------------------------+ 1 row in set, 1 warning (16.46 sec)
如果在 MySQL 老版本运行,可以利用 MySQL 的黑洞引擎,改下 SQL 如下:
[ytt]>create table tmp_checksum (checksum varchar(100)) engine blackhole; Query OK, 0 rows affected (0.08 sec) [ytt]> [ytt]>set @crc='';insert into tmp_checksum Query OK, 0 rows affected (0.00 sec) -> select @crc:= sha(concat_ws('#',@crc,id,r1,r2,r3,r4)) as r from n4; Query OK, 1572864 rows affected, 1 warning (20.11 sec) Records: 1572864 Duplicates: 0 Warnings: 1 [ytt]>select 'n4' tablename,@crc checksum; +-----------+------------------------------------------+ | tablename | checksum | +-----------+------------------------------------------+ | n4 | a9711af93399e0d195a53f4148adea46ab684d30 | +-----------+------------------------------------------+ 1 row in set (0.00 sec)
总结
对于表要计算校验数据一致性的需求,首选第二种自己写 SQL 的方法。
以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于数据库的相关知识,也可关注golang学习网公众号。
-
499 收藏
-
244 收藏
-
235 收藏
-
157 收藏
-
101 收藏
-
449 收藏
-
445 收藏
-
184 收藏
-
237 收藏
-
210 收藏
-
192 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习
-
- 眯眯眼的荔枝
- 好细啊,码住,感谢大佬的这篇博文,我会继续支持!
- 2023-04-20 06:29:57
-
- 魁梧的乌冬面
- 这篇技术文章真及时,很详细,赞 👍👍,mark,关注博主了!希望博主能多写数据库相关的文章。
- 2023-03-30 21:45:21
-
- 辛勤的翅膀
- 这篇文章内容出现的刚刚好,太细致了,赞 👍👍,码起来,关注博主了!希望博主能多写数据库相关的文章。
- 2023-02-17 19:29:32
-
- 寂寞的宝马
- 很棒,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢博主分享文章内容!
- 2023-02-09 02:10:50
-
- 长情的白羊
- 这篇文章真及时,很详细,受益颇多,码起来,关注老哥了!希望老哥能多写数据库相关的文章。
- 2023-02-07 07:38:40
-
- 傻傻的玫瑰
- 真优秀,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢up主分享技术文章!
- 2023-02-06 16:17:12
-
- 单身的路灯
- 很详细,已收藏,感谢老哥的这篇博文,我会继续支持!
- 2023-02-05 14:35:43
-
- 忧郁的太阳
- 写的不错,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢师傅分享文章!
- 2023-02-02 13:35:13
-
- 土豪的猎豹
- 细节满满,码住,感谢作者大大的这篇技术文章,我会继续支持!
- 2023-02-02 07:04:14
-
- 热情的跳跳糖
- 这篇博文真是及时雨啊,细节满满,感谢大佬分享,已加入收藏夹了,关注楼主了!希望楼主能多写数据库相关的文章。
- 2023-01-26 08:31:54
-
- 疯狂的树叶
- 很棒,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,看完之后很有帮助,总算是懂了,感谢up主分享博文!
- 2023-01-25 10:42:30
-
- 激情的玫瑰
- 细节满满,mark,感谢博主的这篇技术文章,我会继续支持!
- 2023-01-22 21:37:46