-
sentinelmonitor三要素(master-name、IP、port)必须准确,缺一不可,否则哨兵无法发现主从拓扑;quorum是触发投票的最小同意数,非哨兵总数;密码需三端一致(requirepass/masterauth/auth-pass),ACL还需配置masteruser;down-after-milliseconds宜设3000–5000ms防误判;启动前须确保主从就绪,否则从节点被误标sdown。
-
reshard搬的是Slot而非Key,先重分配16384个Slot,再由集群自动触发Key迁移;需待“Allkeystransferred”提示才完成,且新节点须完成注册、握手、身份确认三步并满足网络与配置要求。
-
必须显式配置client-output-buffer-limit,否则普通客户端无输出缓冲区上限,易致内存耗尽;需为normal、pubsub等类型分别设置hard/soft限制,尤其pubsub缓冲区最易失控。
-
Redis主从切换后连接池未刷新导致请求超时或Connectionrefused,因Jedis/Lettuce默认不自动感知拓扑变更;需手动重建连接池或使用Lettuce6.0+内置重连机制。
-
必须配合日期动态生成key,因Bitmap无时间维度,共用key会丢失日期信息且导致单key膨胀、RDB/AOF暴增、主从延迟;用户ID须映射为非负整数offset,避免直接强转;BITCOUNT偏高多因key未清理或offset错位;5000万DAU下Bitmap体积约6.25MB,但需防ID稀疏浪费内存。
-
Redis布隆过滤器不支持动态扩容,BF.RESERVE设定的capacity和error_rate不可修改;扩容需手动迁移数据并切换key,参数选错易致内存激增或OOM。
-
缓存击穿是热点key过期瞬间并发请求涌向DB,需用逻辑过期、随机过期时间、分级预热、互斥锁及行为验证来防控。
-
应优先使用pipeline批量发命令替代单条轮询,避免高RTT开销;对计数类操作用INCR/DECR原子增减;设值带过期统一用SET的EX/PX/NX参数;高频读不变Key应加客户端本地缓存。
-
发布订阅模式适合实时性要求极高、可容忍消息丢失、一对多广播型通知场景,如服务状态广播、实时日志分发、WebSocket用户事件广播;Stream适合需持久化、至少一次投递、支持消费者组与重试的场景,如订单异步处理、用户行为埋点、审计日志归档。
-
RedisLua脚本执行失败常因忽略redis.call()返回值,应检查是否为错误表;EVALSHA需确保脚本已重载;redis.log()日志需调高loglevel且查服务端文件;KEYS必须显式声明,禁用KEYS命令。
-
主库卡顿导致从库失联时,应先执行INFOreplication检查connected_slaves、master_repl_offset和repl_backlog_active状态,再调大repl-backlog-size和client-output-buffer-limit,接着用SLOWLOGGET定位慢命令,最后校准Lettuce超时配置并排查大key。
-
主节点磁盘满导致bgsave失败,进而使从节点全量同步卡在wait_bgsave状态;需通过df-h查Redis实际dir路径磁盘使用率、日志中“Nospaceleftondevice”报错及infopersistence中rdb_bgsave_in_progress异常确认。
-
redis-cli--clusterfix并非万能修复器,仅解决Slot被多节点声明的明确冲突,对Slot丢失、元数据错乱、nodes.conf未刷新等问题无效;它只比对并修正冲突项,不处理“看似合理实则失效”的条目。
-
能,BITPOS返回第一个值为1的bit位偏移量(从0开始),需结合写入时的时间粒度和起始时间换算为真实时间,全0时返回-1。
-
应人工错峰RDB触发时间,如实例A用save8971、B用9031、C用9061,并差异化配置AOF重写阈值、禁用THP、限制maxmemory及使用cgroup隔离资源。