登录
首页 >  文章 >  linux

Linux下Canal安装配置及MySQL同步指南

时间:2026-04-29 17:29:36 381浏览 收藏

本文深入剖析了Linux环境下Canal与MySQL实现稳定数据同步的核心配置要点,直击80%用户启动失败的根源——并非版本兼容问题,而是MySQL的ROW格式、唯一非零server_id、log_bin开启及REPLICATION CLIENT+SELECT权限等关键配置未对齐,同时详解canal.instance.master.position初始位点设置、slaveId冲突规避、tsdb.enable必启、字符集显式声明(UTF-8)以及监听范围精准过滤等易被忽视却至关重要的参数细节,为开发者提供一份开箱即用、避坑高效的实战指南。

Linux系统下安装和配置Canal 实现MySQL增量数据同步教程

Canal 能不能跑起来,80% 的问题出在 MySQL 配置和 Canal 实例参数不匹配上,不是版本不兼容,而是 binlog-formatserver_idslaveId 这几个关键项没对齐,或者权限漏了 REPLICATION CLIENT

MySQL 必须开 ROW 模式 + 正确 server_id

Canal 依赖 MySQL 的 binlog 日志流,而只有 ROW 格式才能拿到具体字段变更值(比如 UPDATE 后 name 从“张三”变“李四”)。STATEMENTMIXED 会导致解析失败或数据丢失。

  • 执行 SHOW VARIABLES LIKE 'binlog_format';,结果必须是 ROW
  • 执行 SHOW VARIABLES LIKE 'server_id';,值不能为 0,且在整个集群中唯一(主库设为 1,从库不能也用 1)
  • log_bin 必须为 ON;如果显示 OFF,说明配置没生效或没重启 MySQL
  • 修改 /etc/my.cnf(或 /etc/mysql/my.cnf)的 [mysqld] 段落,至少加这四行:
    log-bin=mysql-bin
    binlog-format=ROW
    server_id=1
    expire_logs_days=3
  • 改完后必须执行 sudo systemctl restart mysql(Ubuntu/Debian)或 sudo systemctl restart mysqld(CentOS/RHEL)

同步账号权限不能只给 REPLICATION SLAVE

很多人照着文档只执行 GRANT REPLICATION SLAVE ON *.*,结果 Canal 启动时报 Access denied; you need (at least one of) the SUPER, REPLICATION CLIENT privilege(s) —— 其实缺的是 REPLICATION CLIENT,它用于查询 binlog 状态和位置。

  • 创建账号时必须同时授权两个权限:
    CREATE USER 'canal'@'%' IDENTIFIED BY 'StrongPassw0rd!';
    GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
    FLUSH PRIVILEGES;
  • 生产环境建议把 '%' 换成 Canal 所在服务器的 IP,例如 'canal'@'192.168.10.22'
  • SELECT 权限不是可选的:Canal 在启动时会查 information_schema 获取表结构,没它会卡在初始化阶段
  • 不要用 GRANT ALL PRIVILEGES,Canal 不需要写权限,也不该有

canal.instance.master.position 初始值填错就收不到第一条日志

Canal 第一次启动时,要从某个 binlog 文件的某个偏移量开始拉取。这个偏移量填错,轻则跳过部分变更,重则直接报 Could not find first log file name in binary log index file

  • 先连 MySQL 执行:
    SHOW MASTER STATUS;
    记下 File(如 mysql-bin.000001)和 Position(如 154
  • conf/example/instance.properties 中填:
    canal.instance.master.journal.name=mysql-bin.000001
    canal.instance.master.position=154
  • 如果 MySQL 刚启,Position 通常是 154(5.7+)或 120(5.6),但不能硬编码,必须查
  • 后续重启 Canal 时,这个位置会被自动更新并持久化到 meta.dat,不用再手动改
  • 若想从最新位置开始(忽略历史变更),可清空 conf/example/meta.dat 并把 position 设为 0,但 Canal 会自动定位到当前最新位点

instance.properties 里 slaveId 和 tsdb 配置容易被忽略

Canal 1.1.4+ 默认开启自动生成 slaveId,但如果手动配了 canal.instance.mysql.slaveId=0,又没关掉自动生成,就会冲突导致连接拒绝。

  • 要么删掉 canal.instance.mysql.slaveId 这行(推荐),让 Canal 自动分配
  • 要么显式设一个非 0 值,如 canal.instance.mysql.slaveId=112233,且确保整个 MySQL 集群里没有其他从库用同一 ID
  • canal.instance.tsdb.enable=true 必须打开,否则无法记录消费位点,重启后会重复推送或丢数据
  • 默认用 H2 数据库存储位点(h2),路径在 conf/example/h2/ 下;如需切换 MySQL 存储,要取消注释 canal.instance.tsdb.url 并配置对应账号密码
  • canal.instance.filter.regex 控制监听范围,.*\\..* 表示所有库所有表,上线前务必改成具体库名,如 test\\..*,避免误同步系统表

最常被跳过的其实是 canal.instance.connectionCharset=UTF-8 —— 如果 MySQL 用 utf8mb4,而 Canal 没设字符集,中文字段可能变成乱码或解析失败,这个值必须显式声明。

今天带大家了解了的相关知识,希望对你有所帮助;关于文章的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>