登录
首页 >  文章 >  linux

Linux部署Redis集群实战指南

时间:2026-05-14 23:52:49 265浏览 收藏

本文深入剖析了Linux环境下Redis集群部署与运维中的五大高频痛点:初始化失败(源于残留文件或进程未启动)、主从节点手动分配与slot迁移、客户端重定向异常(MOVED/ASK错误)、扩容后数据不均衡,以及宕机恢复时的节点状态同步难题;通过精准的配置核查、权限规范、命令实操和排错技巧,为读者提供了一套即学即用的集群稳定落地指南。

linux怎么安装redis集群_linux分布式部署【实战】

redis-cli --cluster create 报错 Node is not empty 或 No such file

说明:集群初始化失败,大概率是节点目录残留了 RDB/AOF 文件或 nodes.conf,或者 redis-server 根本没起来。

实操建议:

  • 每个节点启动前,清空数据目录:rm -f /var/lib/redis-cluster/7001/{dump.rdb,appendonly.aof,nodes.conf}
  • 确认 redis-server 进程已运行且监听正确端口:ps aux | grep redis + netstat -tlnp | grep :7001
  • 检查 redis.conf 中必须启用的配置项:cluster-enabled yescluster-config-file nodes.confcluster-node-timeout 5000appendonly yes(否则 failover 可能卡住)
  • 别用 root 启动 Redis;用专用用户(如 redis),否则 redis-cli --cluster 创建时可能因权限问题写不了 nodes.conf

6 节点 3 主 3 从怎么手动分配 slot

说明:默认 redis-cli --cluster create 会平均分 slot(5461 × 3),但你可能需要指定主从关系或迁移已有数据。

实操建议:

  • 先用 --cluster create 建好 6 个空节点,再用 --cluster add-node --cluster-slave --cluster-master-id 加从节点
  • 手动迁移 slot:用 --cluster reshard,交互中输入目标 master 的 node id、要搬的 slot 数量、源节点 id;注意迁移过程客户端会短暂报 Moved 错误,属正常
  • 验证 slot 分布:redis-cli -p 7001 cluster slots,输出里每段第一个数字是起始 slot,第二个是结束 slot,第三个是主节点 ip:port
  • 不要跳过 --cluster check;它会发现 slot 不连续、从节点没握手成功等静默问题

客户端连集群报 MOVED / ASK 重定向失败

说明:客户端没实现集群协议重定向逻辑,或用了只支持单机的驱动(比如老版本 redis-py 或硬编码直连某端口)。

实操建议:

  • Python 必须用 redis.RedisCluster(不是 redis.Redis),且初始化时传 startup_nodes=[{'host': '127.0.0.1', 'port': '7001'}],它会自动发现其余节点
  • Java 用 JedisCluster,别用 Jedis;构造时传入至少一个节点,它会通过 CLUSTER NODES 拉取拓扑
  • 如果用 shell 调试,直接连任意节点后执行 GET key 出现 MOVED 12345 127.0.0.1:7002,就该切到 redis-cli -c -p 7002-c 启用重定向)
  • 防火墙常被忽略:确保所有节点间 7001–7006 端口(服务端口 + 集群总线端口 = 服务端口 + 10000)互通,否则 cluster meet 会超时

扩容加节点后数据不自动均衡

说明:Redis Cluster 不自动 rebalance slot,加完节点只是“空闲状态”,得手动触发迁移。

实操建议:

  • 新增主节点后,先用 --cluster add-node new_host:7007 existing_host:7001 加入集群
  • 再用 --cluster rebalance --cluster-threshold 1(阈值设小点防不均),它会把 slot 从负载高的节点往新节点搬
  • 如果只想迁部分 slot,不用 rebalance,改用 --cluster reshard 并指定 source 和 target node id
  • 迁移期间避免 FLUSHALL 或大量 DEL,可能触发 key 失效风暴;观察 redis-cli -p 7001 cluster info | grep migrating 确认迁移进度

集群里最麻烦的从来不是加机器,而是节点宕机后从节点升主、原主恢复时拒绝加入——这时候 cluster-node-timeoutcluster-require-full-coverage no 的组合容易让人反复怀疑配置。多看几眼 nodes.conf 里每个节点的 fail? 状态和 ping-sent 时间戳,比重装快得多。

好了,本文到此结束,带大家了解了《Linux部署Redis集群实战指南》,希望本文对你有所帮助!关注golang学习网公众号,给大家分享更多文章知识!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>