登录
首页 >  文章 >  linux

Redis集群配置与高可用搭建详解

时间:2026-05-06 14:31:20 118浏览 收藏

本文深入剖析了Redis集群从配置到高可用落地的关键实践,直击初学者和运维人员常踩的“配置即生效”认知误区——Redis Cluster绝非简单开关,而是必须严格满足节点数量、槽位分配、网络互通与配置协同的系统工程;文章不仅详解了cluster-enabled、cluster-config-file、cluster-require-full-coverage等核心参数的强制要求与典型错误,还厘清了MOVED与CLUSTERDOWN的本质区别,揭秘了启动后节点孤立、写入失败、握手失败等高频故障的底层原因,并特别强调了目录隔离、集群总线端口开放、槽迁移风险等极易被忽视却在线上引发严重事故的实战细节,堪称一份避坑指南级的Redis高可用落地手册。

Redis怎么配置集群模式 Redis Cluster高可用环境搭建详解

Redis Cluster 不是“开启某个开关就能自动高可用”,它必须显式启用、手动初始化、严格满足节点数和槽位分配规则,否则会卡在 CLUSTERDOWN 或拒绝写入。

redis.conf 里必须设对的几项 cluster 配置

单个 Redis 实例要参与集群,redis.conf 中以下配置缺一不可,且值不能随意改:

  • cluster-enabled yes:必须开启,注释掉或设为 no 就只是普通实例
  • cluster-config-file nodes-7000.conf:每个实例必须有**唯一文件名**(端口要对应),不能所有节点共用同一个文件,否则启动时会报 Invalid or no cluster configuration file
  • cluster-node-timeout 15000:建议设为 15000ms(15秒)以上,太小容易因网络抖动误判节点下线;太大会延长故障转移时间
  • cluster-require-full-coverage no:关键!默认是 yes,一旦有任意一个哈希槽没被分配,整个集群拒绝写入。测试/开发环境务必改成 no,否则 cluster nodes 看到全是 fail 却找不到原因
  • bind 0.0.0.0 或明确绑定内网 IP(如 bind 192.168.1.100):不能只写 127.0.0.1,否则其他节点无法通过该地址握手
  • protected-mode no:若启用了保护模式又没配密码,集群节点间 meet 会失败,提示 DENIED Redis is running in protected mode

启动 6 个实例后为什么还是孤立节点?

启动 6 个带 cluster-enabled yes 的 Redis 进程,只是“准备好加入集群”,它们彼此不认识。必须主动让它们建立连接:

  • redis-cli -p 7000 cluster meet 127.0.0.1 7001 让 7000 和 7001 握手,再依次 meet 其余节点(7002~7005)
  • 更稳妥的做法是用 redis-cli --cluster create 一次性完成握手 + 槽分配:redis-cli --cluster create 127.0.0.1:7000 127.0.0.1:7001 ... 127.0.0.1:7005 --cluster-replicas 1
  • 如果执行 create 报错 Node is not empty,说明该端口已有 RDB/AOF 文件或旧 nodes-*.conf,需清空 dir 目录或换新目录
  • 执行完 create 后,立刻用 redis-cli -c -p 7000 cluster nodes 查看,每行末尾应有 masterslave 标识,且没有 fail 状态

为什么写入报错 MOVED 或 CLUSTERDOWN?

这两个错误背后原因完全不同,别混淆:

  • MOVED 12345 127.0.0.1:7002:正常现象。说明 key 落在 12345 号槽,当前节点不负责,客户端需重定向。使用 -c 参数启动 redis-cli(即 redis-cli -c -p 7000)才能自动跳转;普通 redis-cli 不支持重定向,会直接报错
  • CLUSTERDOWN Hash slot not served:说明至少有一个哈希槽没被任何 master 节点服务。常见于:--cluster create 执行中途失败、手动 meet 后忘了 addslots、或某个 master 宕机且没从节点顶上。用 redis-cli -p 7000 cluster infocluster_state:okcluster_slots_assigned:16384 两个字段确认
  • 注意:Redis Cluster **不支持 SELECT 切库**,所有操作都在 db 0;也不支持多键命令(如 mget 跨槽 key),会报 CROSSSLOT

实际部署时最容易被忽略的三个细节

不是配置写对就万事大吉,这些点线上出过多次故障:

  • 每个实例的 dir 必须指向**独立目录**,不能多个实例共用同一 dir。否则 RDB/AOF 文件会互相覆盖,nodes-*.conf 写入冲突,启动直接失败
  • 集群通信走的是「集群总线端口」:在客户端端口(如 7000)基础上 +1000,即 7000 实例还需开放 8000 端口。云服务器安全组/防火墙必须放行这批 +1000 端口,否则节点间心跳超时,状态变 fail
  • 加节点或迁移槽位时,redis-cli --cluster reshard--cluster rebalance 是在线操作,但期间部分槽会短暂不可写。务必避开业务高峰,并提前确认目标节点内存充足——迁移大 key 可能触发 OOM

以上就是《Redis集群配置与高可用搭建详解》的详细内容,更多关于Linux的资料请关注golang学习网公众号!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>