登录
首页 >  数据库 >  MySQL

记一次真实的生产环境事故,20万条记录没了,mysql delete命令踩过的坑,不是故意删库

来源:SegmentFault

时间:2023-01-12 11:22:42 454浏览 收藏

有志者,事竟成!如果你在学习数据库,那么本文《记一次真实的生产环境事故,20万条记录没了,mysql delete命令踩过的坑,不是故意删库》,就很适合你!文章讲解的知识点主要包括MySQL、数据库,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~

--本次上线之前的主表,md_poc_survey其他字段我无放进来,和这次要说的bug无关。
DROP TABLE IF EXISTS md_poc_survey;
CREATE TABLE `md_poc_survey` (
  `member_survey_id` int(10) NOT NULL AUTO_INCREMENT COMMENT '会员问卷自增ID'
  PRIMARY KEY (`member_survey_id`)
) ENGINE=InnoDB AUTO_INCREMENT=207054 DEFAULT CHARSET=utf8;

--本次发布是为了修复并发md_poc_survey里面几百条重复数据,这个表当前有20万条正式数据

-- 建立临时表,存放重复的记录,为删除做准备,本地Navicat执行,没有问题
DROP TABLE IF EXISTS tmp_member_survey;
CREATE TABLE tmp_member_survey(
    member_survey int(10)
)ENGINE=INNODB DEFAULT CHARSET=utf8;

-- 临时表中插入重复数据中member_survey_id较大者,即把重复的数据插入临时表,本地执行没有问题,有数据插入
INSERT tmp_member_survey SELECT member_survey_id FROM md_poc_survey WHERE member_id
          IN (
              SELECT a.member_id FROM md_poc_survey a INNER JOIN md_sales_survey_answer b ON a.member_survey_id=b.member_survey_id GROUP BY a.member_id HAVING COUNT(a.member_id) > 1
          ) AND member_survey_id NOT IN (
             SELECT MIN(a.member_survey_id) FROM md_poc_survey a INNER JOIN md_sales_survey_answer b ON a.member_survey_id=b.member_survey_id GROUP BY a.member_id HAVING COUNT(a.member_id) > 1
         );
         
-- 删除md_poc_survey重复数据,本地navicat执行没有报错
 

早上10点半左右发布时,同事也是一段一段sql执行(我只有生产环境查询权限),没有发现错误,执行到delete语句时懵逼了,查询器显示 Affected rows: 200000+,同事刷新了下md_poc_survey表,数据全没了,瞬间部门炸锅了。我就坐在他对面,整个人都不好了,有点要跑路的冲动。

后面客户那边反应历史数据没了,我们说系统不稳定,稍等马上就好,于是技术总监马不停蹄的恢复数据。后面折腾到晚上8点,才完全找回丢失的数据。这也是对我们系统的一次考验:备份机制不完善,操作起来麻烦费时

好了,说一下哪里的问题,创建tmp_member_survey时我的要的是member_survey_id 字段 我写成了member_survey,创建表sql执行也没问题;INSERT数据时,虽然是member_survey字段,能正常插入数据,也没问题。最后delete语句本地执行不会报错,甚至我在测试环境也没有报错,即使不报错主表md_poc_survey 的数据也没有被清空!

在这里插入图片描述

单独执行

SELECT member_survey_id FROM tmp_member_survey AS X

会报错

在这里插入图片描述

为啥生产环境主表md_poc_survey 会被清空呢?
为啥执行

DELETE FROM md_poc_survey WHERE member_survey_id IN (

    SELECT member_survey_id FROM tmp_member_survey AS X

);

不直接报错呢?

幸好没被开除,下一篇总结下原因和数据库备份的方法!

今天关于《记一次真实的生产环境事故,20万条记录没了,mysql delete命令踩过的坑,不是故意删库》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

声明:本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
评论列表