Spring Cloud Eureka 全解 (5) - 自我保护机制

勿忘初心2018-11-01 16:11

此文已由作者张镐薪授权网易云社区发布。

欢迎访问网易云社区,了解更多网易技术产品运营经验。


本文基于SpringCloud-Dalston.SR5


自我保护机制

关闭自我保护机制(默认是打开的):eureka.server.enable-self-preservation=false

自我保护机制:默认情况下,如果Eureka Server在一定时间内没有接收到某个微服务实例的心跳,Eureka Server将会注销该实例(默认90秒)。但是当网络分区故障发生时,微服务与Eureka Server之间无法正常通信,以上行为可能变得非常危险了——因为微服务本身其实是健康的,此时本不应该注销这个微服务。

Eureka通过“自我保护模式”来解决这个问题——当Eureka Server节点在短时间内丢失过多客户端时(可能发生了网络分区故障),那么这个节点就会进入自我保护模式。一旦进入该模式,Eureka Server就会保护服务注册表中的信息,不再删除服务注册表中的数据(也就是不会注销任何微服务)。当网络故障恢复后,该Eureka Server节点会自动退出自我保护模式。

综上,自我保护模式是一种应对网络异常的安全保护措施。它的架构哲学是宁可同时保留所有微服务(健康的微服务和不健康的微服务都会保留),也不盲目注销任何健康的微服务。使用自我保护模式,可以让Eureka集群更加的健壮、稳定。

但是,在我们实际生产中,我们云环境同一个Region下不会发生大规模网络分区状况,所以没有启用自我保护。

相关参数:eureka.server.renewalPercentThreshold = 0.85


整体逻辑


在每一个服务实例注册时:

expectedNumberOfRenewsPerMin += 2
numberOfRenewsPerMinThreshold = RenewalPercentThreshold*numberOfRenewsPerMinThreshold

无论你设置心跳时间是多少,expectedNumberOfRenewsPerMin都是+2(默认心跳时间是30s,每分钟有60s,所以+2,但是没有根据真正的心跳时间修改,应该算是个缺陷

在收到心跳时:

renewsLastMin.increment()

renewsLastMin<numberOfRenewsPerMinThreshold,就会触发自我保护,不会失效过期服务


相关阅读:Spring Cloud Eureka 全解 (1) - 总览篇

Spring Cloud Eureka 全解 (2) - 整体流程篇

Spring Cloud Eureka 全解 (3) - 核心流程-服务注册与取消详解

Spring Cloud Eureka 全解 (4) - 核心流程-服务与实例列表获取详解

Spring Cloud Eureka 全解 (6) - 一些热门QA

Spring Cloud Eureka 全解 (7) - 生产配置最佳实践


免费体验云安全(易盾)内容安全、验证码等服务

更多网易技术、产品、运营经验分享请点击