rediscli连接集群（redis集群连不上）

科技前沿 • 2025-06-11 23:31 • 阅读 37

rediscli连接集群（redis集群连不上）背景 nbsp nbsp nbsp nbsp XXX 服务前后使用了两个 redis cluster 集群集群 A 2018 1 23 前使用在 1 23 之后没有流量但是服务没停集群 B 2018 1 23 后使用 nbsp 原因 nbsp nbsp nbsp nbsp

大家好，我是讯享网，很高兴认识大家。

【背景】

        XXX服务，前后使用了两个redis cluster集群：集群A（2018.1.23前使用，在1.23之后没有流量，但是服务没停），集群B（2018.1.23后使用）。

 

【原因】

        根本原因：两个集群使用相同的实例，导致两个集群的拓扑信息互相伤害拓扑乱掉

        诱因：老集群下线流程有误，服务未停，却把记录服务实例信息的db数据删除了

        恢复缓慢原因：缺少处理cluster的工具&经验，临时写脚本处理   

 

【过程】

        1、给集群B增加新的redis实例（其中选出了和集群A相同的ip和port）

        2、启动集群B的新实例失败，发现和集群B的某个实例相同的ip和port

        3、停掉集群A的具有相同ip和port的实例，集群A的相应实例起来（目前集群B还未将该实例加入自己集群，该实例目前与集群A的其他实例通信）

        4、对集群B操作同步拓扑信息（将上诉实例加入了集群B，上诉实例与集群B中的其他实例相互交换拓扑信息）

        5、集群B中的主都把自己作为了集群A中实例的从，开始主从同步，集群崩溃

 

【处理过程】

        1、停掉集群A的所有实例

        2、强制提升集群B中的相应实例为主（cluster failover takeover -> 将某个从强制提升为主且不与其他实例通信）

        3、修复拓扑状态，检查slot分配，给没有分配master的slot分配master（cluster setslot <slot> node <node-id> -> 发给每个主分配slot信息）

        4、给缺少slave的master挂上slave（cluster replicate ip port）

 

【改进方案】

        1、完善集群下线流程：1）避免删除集群基本信息；2）下线集群时停掉服务（停服务发现、检查流量、停服务、注销systemd）

        2、针对cluster的拓扑修复，提供工具：1）集群拓扑比较工具，找出拓扑不一致的实例；2）批量将实例踢出集群；3）批量提升实例为主？？

 

【思考】

        对于redis cluster这种无中心的架构来说，如果拓扑信息不一致了，如何修复信息确实是挺麻烦的。想到好的方式后，后续补充。

 

小讯

2025年lxml怎么安装（lms2019安装教程）

上一篇 2025-04-15 20:34

2025年如何创建zip文件格式（怎样创建zip文件）

下一篇 2025-04-20 16:08

2025年lxml怎么安装（lms2019安装教程） 1744549180
赛博朋克2077 战斗系统（赛博朋克2077战斗系统） 1744549179
查域名查ip（域名查ip） 1744549179
数据库怎么创建dblink（数据库怎么创建数据表） 1744549178
2025年ifstream读取文件内容（ifstream读取所有内容） 1744549177
window任务管理器快捷键（windows任务管理器快捷） 1744549177
2025年获取位置信息失败怎么解决（微信公众号获取位置信息失败怎么解决） 1744549176
orecal甲骨文（甲骨文的oracle） 1744549174
2025年阻塞队列的实现（阻塞队列的实现必须显示地设置容量） 1744549173
2025年如何创建zip文件格式（怎样创建zip文件） 1744549180
2025年impdp 字符集（expdp字符集） 1744549181
条件变量和互斥锁（条件变量和互斥锁定的区别） 1744549181
spark面试题面试题（spark面试题目） 1744549182
2025年polowalk是什么品牌（polovillae是什么品牌） 1744549183
2025年nfs客户端端口（nfs客户端配置） 1744549184
2025年nat类型检测工具（nat类型检测工具linux） 1744549184
crnaira是什么品牌的手表c019（crnaira是什么品牌的手表） 1744549184
蓝绿色代码（蓝色颜色的代码） 1744549185

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/139036.html