Linuxrsync增量备份实用教程
时间:2026-03-25 09:32:38 441浏览 收藏
本文深入解析了 Linux 中 rsync 实现可靠增量备份的核心原理与实战要点,强调其相较 cp 和 scp 在跳过未变更文件、断点续传、数据校验等方面不可替代的优势,并直击日常使用中高频踩坑点:如遗漏 -a 参数导致时间戳丢失而破坏增量逻辑、远程路径末尾斜杠误用引发同步内容错位、ssh 环境干扰致连接异常、exclude 规则失效、--delete 误删风险,以及一致性验证的轻量级与严格级方案;全文以生产环境真实问题为牵引,层层拆解参数组合背后的机制,揭示“差一个参数就让增量变伪增量”的关键细节,助你构建真正稳健、可验证、可维护的自动化备份体系。

rsync 增量同步为什么比 cp 或 scp 更可靠
因为 rsync 默认只传变化的部分:跳过相同文件、断点续传、校验一致性。而 cp 会全量覆盖,scp 没有差异判断,网络中断就得重来。
常见错误现象:rsync: connection unexpectedly closed(没加 -e 指定 ssh 参数时,远程 shell 环境输出干扰);或本地文件变大了但远程没更新(漏了 -a,没保留时间戳,导致下次误判为“已变更”)。
-a是核心:等价于-rlptgoD,保留权限、软链、时间戳、属主等——缺一不可,否则增量逻辑失效--delete要慎用:它会删掉目标端有、源端没有的文件;备份场景建议先加--dry-run预览- 远程路径写法必须明确:
user@host:/path/结尾的/很关键——/path同步的是目录本身,/path/同步的是目录内容
如何避免 rsync 同步时卡住或超时
本质是 ssh 层面的连接稳定性问题,不是 rsync 本身 bug。默认 ssh 交互式连接在无响应时会挂起,尤其跨公网或高延迟网络。
使用场景:定时备份脚本跑在 cron 里,结果某次卡住,后续任务堆积。
- 强制非交互 + 超时控制:加
-e "ssh -o ConnectTimeout=10 -o BatchMode=yes" - 避免 shell 初始化干扰:远程命令前加
sh -c 'exec rsync ...',或在远程~/.bashrc开头加[[ -z $PS1 ]] && return,防止输出乱码破坏协议流 - 大文件传输建议加
--partial --progress:断点续传 + 实时看进度,比默认静默更可控
rsync 备份到远程服务器时,排除临时文件的正确写法
很多人用 --exclude "*.tmp" 发现没生效,其实是匹配逻辑和路径上下文理解错了。
rsync 的排除规则基于「发送端路径相对值」,且不自动递归展开 glob——所以 *.tmp 只匹配当前目录下的 tmp 文件,子目录里的不会被扫到。
- 要用
--exclude="*.tmp"+--exclude="**/*.tmp"(注意双星号支持需 rsync ≥ 3.1.0) - 更稳的方式是写进文件:
--exclude-from="/path/to/exclude.list",每行一个模式,支持#注释和空行 - 别忘了排除
.DS_Store、Thumbs.db、__pycache__这类高频干扰项,否则每次触发无意义同步
rsync 增量备份后,怎么验证两边文件真的一致
光看文件大小和修改时间不够——硬链接、稀疏文件、ACL 权限、xattr 扩展属性都可能不同,但 rsync -a 默认并不同步 xattr(除非加 -X)。
性能影响明显:用 sha256sum 全量比对太慢;用 rsync --dry-run -ai 只能看差异,不保证字节一致。
- 最轻量验证法:在目标端运行
rsync -n -aHAX --delete source/ dest/,若输出为空,说明结构 & 内容一致(前提是源端没改过) - 要严格字节一致:加
--checksum强制比对摘要(但会显著拖慢速度,仅调试用) - 容易被忽略的点:如果源是 btrfs/xfs 文件系统且启用了 reflink,
rsync默认不复刻 reflink,得加--reflink=always(需 rsync ≥ 3.1.2)
备份这事,差一个参数就可能让“增量”变成“伪增量”,最后发现磁盘占满却恢复不了——盯紧 -a 和路径末尾的 /,比什么都管用。
终于介绍完啦!小伙伴们,这篇关于《Linuxrsync增量备份实用教程》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
266 收藏
-
280 收藏
-
382 收藏
-
124 收藏
-
240 收藏
-
403 收藏
-
117 收藏
-
373 收藏
-
185 收藏
-
201 收藏
-
393 收藏
-
149 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习