Linux部署Redis集群实战指南
时间:2026-05-14 23:52:49 265浏览 收藏
本文深入剖析了Linux环境下Redis集群部署与运维中的五大高频痛点:初始化失败(源于残留文件或进程未启动)、主从节点手动分配与slot迁移、客户端重定向异常(MOVED/ASK错误)、扩容后数据不均衡,以及宕机恢复时的节点状态同步难题;通过精准的配置核查、权限规范、命令实操和排错技巧,为读者提供了一套即学即用的集群稳定落地指南。

redis-cli --cluster create 报错 Node is not empty 或 No such file
说明:集群初始化失败,大概率是节点目录残留了 RDB/AOF 文件或 nodes.conf,或者 redis-server 根本没起来。
实操建议:
- 每个节点启动前,清空数据目录:
rm -f /var/lib/redis-cluster/7001/{dump.rdb,appendonly.aof,nodes.conf} - 确认
redis-server进程已运行且监听正确端口:ps aux | grep redis+netstat -tlnp | grep :7001 - 检查
redis.conf中必须启用的配置项:cluster-enabled yes、cluster-config-file nodes.conf、cluster-node-timeout 5000、appendonly yes(否则 failover 可能卡住) - 别用 root 启动 Redis;用专用用户(如
redis),否则redis-cli --cluster创建时可能因权限问题写不了nodes.conf
6 节点 3 主 3 从怎么手动分配 slot
说明:默认 redis-cli --cluster create 会平均分 slot(5461 × 3),但你可能需要指定主从关系或迁移已有数据。
实操建议:
- 先用
--cluster create建好 6 个空节点,再用--cluster add-node --cluster-slave --cluster-master-id加从节点 - 手动迁移 slot:用
--cluster reshard,交互中输入目标 master 的node id、要搬的 slot 数量、源节点 id;注意迁移过程客户端会短暂报Moved错误,属正常 - 验证 slot 分布:
redis-cli -p 7001 cluster slots,输出里每段第一个数字是起始 slot,第二个是结束 slot,第三个是主节点 ip:port - 不要跳过
--cluster check;它会发现 slot 不连续、从节点没握手成功等静默问题
客户端连集群报 MOVED / ASK 重定向失败
说明:客户端没实现集群协议重定向逻辑,或用了只支持单机的驱动(比如老版本 redis-py 或硬编码直连某端口)。
实操建议:
- Python 必须用
redis.RedisCluster(不是redis.Redis),且初始化时传startup_nodes=[{'host': '127.0.0.1', 'port': '7001'}],它会自动发现其余节点 - Java 用
JedisCluster,别用Jedis;构造时传入至少一个节点,它会通过CLUSTER NODES拉取拓扑 - 如果用 shell 调试,直接连任意节点后执行
GET key出现MOVED 12345 127.0.0.1:7002,就该切到redis-cli -c -p 7002(-c启用重定向) - 防火墙常被忽略:确保所有节点间 7001–7006 端口(服务端口 + 集群总线端口 = 服务端口 + 10000)互通,否则
cluster meet会超时
扩容加节点后数据不自动均衡
说明:Redis Cluster 不自动 rebalance slot,加完节点只是“空闲状态”,得手动触发迁移。
实操建议:
- 新增主节点后,先用
--cluster add-node new_host:7007 existing_host:7001加入集群 - 再用
--cluster rebalance --cluster-threshold 1(阈值设小点防不均),它会把 slot 从负载高的节点往新节点搬 - 如果只想迁部分 slot,不用
rebalance,改用--cluster reshard并指定 source 和 target node id - 迁移期间避免
FLUSHALL或大量DEL,可能触发 key 失效风暴;观察redis-cli -p 7001 cluster info | grep migrating确认迁移进度
集群里最麻烦的从来不是加机器,而是节点宕机后从节点升主、原主恢复时拒绝加入——这时候 cluster-node-timeout 和 cluster-require-full-coverage no 的组合容易让人反复怀疑配置。多看几眼 nodes.conf 里每个节点的 fail? 状态和 ping-sent 时间戳,比重装快得多。
好了,本文到此结束,带大家了解了《Linux部署Redis集群实战指南》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多文章知识!
相关阅读
更多>
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
-
501 收藏
最新阅读
更多>
-
265 收藏
-
422 收藏
-
278 收藏
-
404 收藏
-
268 收藏
-
409 收藏
-
382 收藏
-
217 收藏
-
406 收藏
-
195 收藏
-
187 收藏
-
207 收藏
课程推荐
更多>
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 485次学习