-
通过redis-cli、RedisInsight、Prometheus和Grafana等工具,以及关注内存使用率、连接数、集群节点状态、数据一致性和性能指标,可以有效监控Redis集群的健康状态。
-
RDB快照非实时落盘,依赖bgsave子进程异步生成,期间新写入数据不包含在本次快照中;AOF重写通过双缓冲保障新命令不丢失;混合持久化仅存储格式混合,写入仍按appendfsync策略执行。
-
在Redis集群中查某个key的实时内存占用需先定位其所在slot和节点:用CLUSTERKEYSLOT算slot号,CLUSTERSLOTS查对应主节点IP:PORT,再连该节点执行MEMORYUSAGE;因官方redis-cli--cluster不支持透传该命令,且结果为估算值,需注意偏差与重试机制。
-
应使用Redis的Hash或ZSet维护用户会话映射,新登录时先获取并删除旧会话缓存及黑名单,配合事务或Lua脚本保证并发安全,而非仅依赖EXPIRE。
-
Redis过期事件非实时触发,仅在键被真正删除时发布__keyevent@0__:expired消息,存在延迟且不保证100%送达;需显式配置notify-keyspace-eventsEx,SpringBoot需正确配置RedisMessageListenerContainer并指定精确频道名。
-
Redis不设maxmemory时不会触发淘汰机制,因默认策略noeviction且不启动任何淘汰逻辑,内存持续增长直至OOMKiller强杀进程。
-
用RedisINFOstats的keyspace_hits和keyspace_misses实时计算命中率,低于70%且5分钟滚动均值持续异常即告警;结合DB空查询日志确认缓存穿透;布隆过滤器须前置、全量预热、与DB写操作强一致,拦截非法ID;对已存在但已失效的ID,通过空查日志聚类+内存黑名单防控。
-
根本原因是RedisGEO基于zset实现,每个成员存原始坐标和geohash整数两份数据,且5.0前逐个解析导致跳表与哈希表频繁双更新,叠加浮点转geohash计算开销。
-
典型现象是Redis从节点反复断连,日志出现“Clientclosedconnectionduetooutputbufferlimit”,INFOreplication中状态在connect→sync→disconnected循环;主节点因输出缓冲区超限(默认slave256MB/64MB/60s)主动断开连接。
-
Redis禁止BGSAVE与BGREWRITEAOF并发执行,是为避免双子进程争抢CPU、I/O、COW内存页及fsync队列;前者返回错误,后者被排队;no-appendfsync-on-rewriteyes可缓解AOF重写时主进程fsync阻塞,但对BGSAVE无效。
-
根本原因是Redis集群要求多键操作的key必须位于同一slot,而HashTag(如{user:1}:profile)通过仅哈希花括号内内容实现强制同槽,但需命令本身支持多key且全链路保留括号语义。
-
用SETBIT和GETBIT做存在性判断最直接:SETBIT设定位为1,GETBIT查该位是否为1,O(1)时间、极省空间;不可用BITCOUNT替代,不支持三态,需确保ID到偏移量映射一致。
-
不能。RedisList无自动回绕机制,需配合LTRIM控制长度实现伪循环队列;RPOPLPUSH不限长也不丢弃数据;原子性操作须用Lua脚本封装;Stream的MAXLEN更贴近循环语义但不支持随机访问。
-
Redis集群中Lua脚本不会触发传统死锁,但会因单线程执行而阻塞整个节点;无限循环脚本导致该节点所有命令超时,需通过CLIENTLIST、INFOcommandstats及CLUSTERNODES识别异常,并依赖lua-time-limit、计数器循环、客户端超时与限流等机制防控。
-
Redis集群不自动随机化过期时间,需业务层实现;限流须在应用层或网关层统一控制;热点key需加扰动后缀分散分片;三者叠加(集群+随机过期+限流)且随机范围≥±5%才有效防雪崩。