登录
首页 >  文章 >  linux

Linuxrsync备份教程:数据同步实战教学

时间:2026-03-03 09:24:00 203浏览 收藏

本文深入剖析了Linux下rsync增量备份实践中最常踩的四大“坑”:因mtime不准导致文件未同步时应启用--times或更可靠的--checksum校验;SSH连接失败需优先排查sshd服务、防火墙和网络可达性而非修改rsync参数;--exclude失效多因路径匹配逻辑和命令顺序错误,强调相对路径规则与--exclude-from的最佳实践;cron定时任务中密钥权限与环境差异引发的认证失败,则必须显式指定私钥路径并严格设置600权限。文章不止讲命令怎么写,更聚焦真实生产环境中的隐性故障点——提醒你:再完美的备份脚本,若缺乏验证(如--dry-run或手动抽查),本质上等同于无效备份。

Linux怎么备份重要数据_Linux rsync命令同步教程【容灾】

rsync 增量同步时文件没更新?检查 --times--checksum

rsync 默认靠文件大小 + 修改时间判断是否跳过,但 NFS、某些容器挂载或跨时区同步时,mtime 可能不准,导致该传的没传。
常见现象是目标端文件内容旧,但 rsync 却显示 “up to date”。
解决方法:

  • --times 强制保留源时间戳(避免因时间偏差误判)
  • 更彻底的方案是加 --checksum:逐块比对校验和,不依赖时间,但会慢一点、CPU 高一点
  • 如果只同步代码或文本,且确认没时区问题,--size-only 反而更快

备份到远程服务器失败,报 ssh: connect to host xxx port 22: Connection refused

这不是 rsync 的错,是 SSH 连接层不通。别急着改 rsync 参数。
先确认三点:

  • 目标机器是否开了 sshd?运行 systemctl is-active sshd 看是不是 active
  • 防火墙是否放行了 22 端口?sudo ufw statussudo iptables -L | grep :22
  • 是否用错了地址?比如把内网 IP 当公网用,或 DNS 没解析——直接 pingnc -zv hostname 22 测试连通性
一旦 SSH 能通,rsync over SSH 就自然可用,无需额外配置。

想排除临时文件和日志,但 --exclude 不生效?注意路径写法和顺序

rsync 的 --exclude 是按命令行从左到右匹配的,而且模式匹配的是“相对于源路径”的相对路径。
比如你执行:rsync -av --exclude='*.log' /var/www/ user@backup:/backup/,那 *.log 匹配的是 /var/www/ 下的 *.log,不会影响 /var/www/logs/app.log
要排除所有层级的日志文件,得写成:

  • --exclude='**/*.log'(需要 rsync ≥ 3.1.0)
  • 或者更兼容的写法:--exclude='*.log' --exclude='logs/' --exclude='.tmp'
  • 排除规则必须放在源路径 之前,否则会被忽略
建议把常用排除项写进 --exclude-from=excludes.txt,方便复用和 review。

每天定时备份,crontab 里 rsync 报 Permission denied (publickey)

cron 环境变量和你终端不一样,特别是 $HOMESSH_AUTH_SOCK,所以交互式能用的密钥,在 cron 里常失效。
最稳的做法:

  • -e "ssh -i /path/to/id_rsa" 显式指定私钥路径,不要依赖 ~/.ssh/config
  • 确保私钥权限是 600,且属主是运行 cron 的用户(ls -l /path/to/id_rsa 看一眼)
  • 测试前先用 sudo -u username bash -c 'ssh -i /path/to/id_rsa user@host ls' 模拟 cron 环境
别为了省事开密码登录——容灾备份链路一旦被爆破,后果比多写两行命令严重得多。

真正难的不是写对 rsync 命令,而是每次备份后花 10 秒手动 ls -lR 看一眼关键目录,或加个 --dry-run 先跑一遍。没人检查的备份,和没备份一样。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《Linuxrsync备份教程:数据同步实战教学》文章吧,也可关注golang学习网公众号了解相关技术文章。

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>