DukeDuke
主页
项目文档
技术文档
  • 单机版
  • 微服务
  • 代办项目
  • 优鲜项目
项目管理
关于我们
主页
项目文档
技术文档
  • 单机版
  • 微服务
  • 代办项目
  • 优鲜项目
项目管理
关于我们
  • 技术文档

    • 网络原理

      • 交换机
      • 路由器
      • TCP/IP协议
      • HTTP 与 HTTPS
    • 软件架构

      • 什么是软件架构
      • 分层架构
      • 微服务架构
      • 事件驱动架构
      • 领域驱动设计(DDD)
      • 架构图
      • 高并发系统
    • Vue3

      • Vue3简介
      • Vue3响应式系统
      • Vue3组合式API
      • Vue3生命周期
      • Vue3模板语法
      • Vue3组件系统
      • Vue3 路由系统
      • Vue3 状态管理
      • Vue3 性能优化
      • Vue3 TypeScript 支持
      • Vue3 项目实战
      • VUE 面试题大全
      • Node.js 安装
    • JAVA

      • JVM

        • 认识JVM
        • JVM类加载器
        • 运行时数据区
        • 执行引擎
        • 本地方法接口
        • 本地方法库
        • JVM垃圾回收
        • JVM性能监控
        • JVM调优
      • 设计模式
        • 单例模式
        • 工厂模式
        • 策略模式
        • 适配器模式
        • 建造者模式
        • 原型模式
        • 装饰器模式
        • 代理模式
        • 外观模式
        • 享元模式
        • 组合模式
        • 桥接模式
      • Java多线程

        • Java 线程基础详解
        • Java 线程池详解
        • Java ThreadLocal 详解
        • Java volatile 详解
        • Java 线程间通信详解
        • Java 线程安全详解
        • Java 线程调度详解
        • Java 线程优先级详解

        • Java 线程中断详解
        • Java 线程死锁详解
      • Java反射
      • Java 面试题

        • Java 基础概念面试题
        • Java 面向对象编程面试题
        • Java 集合框架面试题
        • Java 多线程与并发面试题
        • JVM 与内存管理面试题
        • Java I/O 与 NIO 面试题
        • Java 异常处理面试题
        • Java 反射与注解面试题
        • Java Spring 框架面试题
        • Java 数据库与 JDBC 面试题
        • Java 性能优化面试题
        • Java 实际项目经验面试题
        • Java 高级特性面试题
        • Java 面试准备建议
    • Python

      • Python简介
      • Python安装
      • Python hello world
      • Python基础语法
      • Python数据类型
      • Python数字
      • Python字符串
      • Python列表
      • Python元组
      • Python字典
      • Python日期时间
      • Python文件操作
      • Python异常处理
      • Python函数
      • Python类
      • Python模块
      • Python包
      • Python多线程
      • Python面向对象
      • Python爬虫
      • Django web框架
      • Python 面试题

        • Python 面试题导航
        • Python 基础概念
        • Python 面向对象编程
        • Python 数据结构
        • Python 高级特性
        • Python 框架
        • Python 性能优化
        • Python 项目经验
    • Spring

      • Spring
      • Springboot
      • Spring Security 安全框架
      • SpringBoot 中的事件详解
      • SpringBoot 中的定时任务详解
      • SpringBoot 自动装配原理与源码解释
    • Mybatis

      • Mybatis
      • Mybatis-Plus
    • 数据库

      • Redis

        • Redis简介
        • Redis(单机)安装
        • Redis配置
        • Redis数据结构
        • RDB、AOF 和混合持久化机制
        • Redis内存管理
        • Redis缓存一致性
        • Redis缓存穿透
        • Redis缓存击穿
        • Redis缓存雪崩
        • Redis Lua脚本
        • Redis主从复制
        • Redis哨兵模式
        • Redis集群
        • Redis数据分片
        • Redis CPU使用率过高
        • Redis面试题
      • MySQL

        • MySQL简介
        • MySQL安装
        • MySQL配置
        • MYSQL日常维护
        • MYSQL优化-慢查询
        • MYSQL优化-索引
        • MYSQL数据库设计规范
    • 消息队列

      • RocketMQ
      • Kafka
      • RabbitMQ
      • 消息队列面试题
    • 微服务

      • SpringCloud 微服务
      • Eureka 注册中心
      • Nacos 注册中心
      • Gateway 网关
      • Feign 服务调用
      • Sentinel 限流 与 熔断
      • Seata 分布式事务
      • CAP 理论
      • Redis 分布式锁
      • 高并发系统设计
    • ELK日志分析系统

      • Elasticsearch 搜索引擎
      • Logstash 数据处理
      • Kibana 可视化
      • ELK 实战
    • 开放API

      • 开放API设计
      • 开放API示例项目
    • 人工智能

      • 人工智能简介
      • 机器学习

      • 深度学习

      • 自然语言处理

      • 计算机视觉

        • CUDA与cuDNN详细安装
        • Conda 安装
        • Pytorch 深度学习框架
        • yolo 目标检测
        • TensorRT 深度学习推理优化引擎
        • TensorFlow 机器学习
        • CVAT 图像标注
        • Windows 下安装 CUDA、cuDNN、TensorRT、TensorRT-YOLO 环境
        • Windows10+CUDA+cuDNN+TensorRT+TensorRT-YOLO 部署高性能YOLO11推理
    • 大数据

      • 大数据简介
      • Hadoop 数据存储
      • Flume 数据采集
      • Sqoop 数据导入导出
      • Hive 数据仓库
      • Spark 数据处理
      • Flink 数据处理
      • Kafka 数据采集
      • HBase 数据存储
      • Elasticsearch 搜索引擎
    • 图像处理

      • 图像处理简介
      • 医学图像web呈现
      • 医学图像处理
      • 切片细胞分离问题
    • 服务器&运维

      • Linux 系统

        • Linux 系统管理
        • Linux 网络管理
        • Linux 文件管理
        • Linux 命令大全
      • Nginx Web 服务器

        • Nginx 安装 与 配置
        • Nginx 负载均衡
        • Nginx SSL证书配置
        • Nginx Keepalived 高可用
      • Docker 容器

        • Docker 简介
        • Docker 安装与配置
        • Docker 命令
        • Docker 部署 Nginx
        • Docker 部署 MySQL
        • Docker 部署 Redis
      • 服务器

        • 塔式服务器
        • 机架式服务器
        • 刀片服务器
      • Git 版本控制
      • Jenkins 持续集成
      • Jmeter 性能测试
      • Let's Encrypt 免费SSL证书
    • 简历

      • 项目经理简历
      • 开发工程师简历

Redis 哨兵(Sentinel)模式

1. 哨兵模式简介

Redis 哨兵模式是 Redis 的高可用解决方案,它通过监控 Redis 主从节点的状态,在主节点发生故障时自动进行故障转移,确保 Redis 服务的可用性。

  • 监控(Monitoring):哨兵会定期检查主从节点是否按预期工作
  • 通知(Notification):当被监控的节点出现问题时,哨兵可以通过 API 向管理员或其他应用程序发送通知
  • 自动故障转移(Automatic failover):当主节点不能正常工作时,哨兵会自动将一个从节点升级为新的主节点
  • 配置提供者(Configuration provider):客户端连接 Redis 服务器时,会先询问哨兵获取当前主节点的地址

2. 哨兵工作原理

Redis 哨兵模式的核心工作原理是通过多个哨兵节点协同工作,实现对 Redis 主从集群的监控和自动故障转移。每个哨兵节点都会定期执行以下任务:

HSV

  1. 监控:哨兵会每秒向所有被监控的主从节点发送 PING 命令,检查它们是否正常工作
  2. 通知:当发现节点异常时,哨兵会通过发布/订阅机制向其他哨兵节点发送通知
  3. 自动故障转移:当主节点故障时,哨兵会自动选择一个从节点升级为新的主节点

2.1 主观下线和客观下线

  • 主观下线(SDOWN):当单个哨兵节点在配置的超时时间内(默认 30 秒)无法与主节点通信时,该哨兵会认为主节点主观下线。这可能是由于网络问题或主节点确实出现问题导致的。 HSV

  • 客观下线(ODOWN):当超过配置数量的哨兵节点(通常为哨兵总数的半数以上)都认为主节点主观下线时,主节点会被标记为客观下线。这表示主节点确实出现了问题,需要执行故障转移。 HSV

2.2 故障转移流程

  1. 哨兵发现主节点不可用:某个哨兵节点发现主节点无法通信,将其标记为主观下线
  2. 多个哨兵确认主节点客观下线:其他哨兵节点也确认主节点不可用,达到客观下线条件
  3. 选举领头哨兵:哨兵节点通过 Raft 算法选举出一个领头哨兵,由它来执行故障转移
  4. 领头哨兵选择新的主节点:根据以下规则选择新的主节点:
    • 优先级最高的从节点
    • 复制偏移量最大的从节点
    • 运行 ID 最小的从节点
  5. 执行故障转移:
    • 将选中的从节点升级为主节点
    • 将其他从节点的主节点指向新的主节点
    • 将原主节点降级为从节点
  6. 更新配置:所有哨兵节点更新其监控的配置信息

3. 三台服务器哨兵配置

3.1 架构说明

假设我们有以下三台服务器:

  • 主节点(Master): 192.168.1.101
  • 从节点 1(Slave1): 192.168.1.102
  • 从节点 2(Slave2): 192.168.1.103

每台服务器上都需要运行 Redis 实例和哨兵实例。

3.2 Redis 主从配置

主节点配置(192.168.1.101)

# redis.conf
port 6379
bind 192.168.1.101
daemonize yes
pidfile /var/run/redis_6379.pid
logfile "/var/log/redis_6379.log"

从节点配置(192.168.1.102 和 192.168.1.103)

# redis.conf
port 6379
bind 192.168.1.102  # 或 192.168.1.103
daemonize yes
pidfile /var/run/redis_6379.pid
logfile "/var/log/redis_6379.log"
slaveof 192.168.1.101 6379

3.3 哨兵配置

在所有三台服务器上都需要配置哨兵:

# sentinel.conf
port 26379
bind 192.168.1.101  # 根据实际服务器IP修改
daemonize yes
pidfile /var/run/redis-sentinel.pid
logfile "/var/log/redis-sentinel.log"

# 监控主节点
sentinel monitor mymaster 192.168.1.101 6379 2
# 设置主节点密码(如果有)
# sentinel auth-pass mymaster yourpassword
# 设置故障转移超时时间
sentinel down-after-milliseconds mymaster 5000
# 设置故障转移超时时间
sentinel failover-timeout mymaster 60000
# 设置故障转移时,最多有多少个从节点同时对新的主节点进行同步
sentinel parallel-syncs mymaster 1

3.4 启动顺序

  1. 启动主节点 Redis 服务
  2. 启动从节点 Redis 服务
  3. 启动所有哨兵服务
# 启动Redis
redis-server /path/to/redis.conf

# 启动哨兵
redis-sentinel /path/to/sentinel.conf

4. 注意事项

  1. 建议使用奇数个哨兵节点
  2. 哨兵节点之间需要能够相互通信
  3. 确保网络稳定性
  4. 定期备份数据
  5. 监控哨兵日志
最近更新:: 2025/8/14 09:20
Contributors: Duke
Prev
Redis主从复制
Next
Redis集群