SpringCloud Alibaba-5-服务容错

1. 微服务架构中高并发带来的问题

在微服务架构中,我们将业务拆分成一个个的服务,服务与服务之间可以相互调用,

但是由于网络原因或者自身的原因,服务并不能保证服务的100%可用。

如果单个服务出现问题,调用这个服务就会出现网络延迟,此时若有大量的网络涌入,会形成任务堆积,最终导致服务瘫痪。






2. 服务雪崩效应

在分布式系统中,由于网络原因或自身的原因,服务一般无法保证 100% 可用。

如果一个服务出现了问题,调用这个服务就会出现线程阻塞的情况,此时若有大量的请求涌入,就会出现多条线程阻塞等待,进而导致服务瘫痪。

由于服务与服务之间的依赖性,故障会传播,会对整个微服务系统造成灾难性的严重后果,这就是服务故障的 “雪崩效应” 。






3. 服务雪崩常见容错方案

常见的容错思路有隔离、超时、限流、熔断、降级这几种。

  • 隔离
    指将系统按照一定的原则划分为若干个服务模块,各个模块之间相对独立,无强依赖。
    当有故障发生时,能将问题和影响隔离在某个模块内部,而不扩散风险,不波及其它模块,不影响整体的系统服务。
    常见的隔离方式有:线程池隔离和信号量隔离

  • 超时
    指在上游服务调用下游服务的时候,设置一个最大响应时间,如果超过这个时间,下游未作出反应,就断开请求,释放掉线程。

  • 限流
    指限制系统的输入和输出流量以达到保护系统的目的。
    为了保证系统的稳固运行,一旦达到的需要限制的阈值,就需要限制流量并采取少量措施以完成限制流量的目的。

  • 熔断
    指当下游服务因访问压力过大而响应变慢或失败,上游服务为了保护系统整体的可用性,可以暂时切断对下游服务的调用。
    这种牺牲局部,保全整体的措施就叫做熔断。

  • 降级
    指为服务提供一个托底方案,一旦服务无法正常调用,就使用托底方案。






4. 常见的容错组件

  • Hystrix
    Hystrix是由Netflix开源的一个延迟和容错库,用于隔离访问远程系统、服务或者第三方库,防止级联失败,从而提升系统的可用性与容错性。

  • Sentinel
    阿里巴巴开源的一款断路器实现,本身在阿里内部已经被大规模采用,非常稳定。






5. Hystrix快速入门

PS:Hystrix已经不维护了。
https://www.cnblogs.com/itlihao/p/14521694.html






6. Sentinel快速入门-集成Sentinel

6.1 什么是Sentinel

Sentinel (分布式系统的流量防卫兵) 是阿里开源的一套用于服务容错的综合性解决方案。

以流量为切入点, 从流量控制、熔断降级、系统负载保护等多个维度来保护服务的稳定性。


Sentinel 分为两个部分:

  • 核心库(Java 客户端)不依赖任何框架/库,能够运行于所有 Java 运行时环境,同时对 Dubbo /Spring Cloud 等框架也有较好的支持。

  • 控制台(Dashboard)基于 Spring Boot 开发,打包后可以直接运行,不需要额外的 Tomcat 等应用容器。

6.2 微服务集成Sentinel

添加依赖

    <dependency>    
      <groupId>com.alibaba.cloud</groupId>    
      <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>
    </dependency>

安装Sentinel控制台






7. Sentinel的概念和功能

7.1 基本概念

  • 资源
    Sentinel的资源就是指Sentinel要保护的东西(它可以是 Java 应用程序中的任何内容,可以是一个服务,也可以是一个方法,甚至可以是一段代码。)。

  • 规则
    Sentinel的规则就是指定义如何进行保护资源。

作用在资源之上, 定义以什么样的方式保护资源,主要包括流量控制规则、熔断降级规则以及系统保护规则。

  • 功能
    Sentinel的主要功能就是容错,主要体现在如下三个方面:
    1. 流量控制

    2. 熔断降级
      当检测到调用链路中某个资源出现不稳定的表现,例如请求响应时间长或异常比例升高的时候,则对这个资源的调用进行限制,让请求快速失败,避免影响到其它的资源而导致级联故障。
      Sentinel 对这个问题采取了两种手段:通过并发线程数进行限制Sentinel 通过限制资源并发线程的数量,来减少不稳定资源对其它资源的影响。当某个资源出现不稳定的情况下,例如响应时间变长,对资源的直接影响就是会造成线程数的逐步堆积。当线程数在特定资源上堆积到一定的数量之后,对该资源的新请求就会被拒绝。堆积的线程完成任务后才开始继续接收请求。通过响应时间对资源进行降级除了对并发线程数进行控制以外,Sentinel 还可以通过响应时间来快速降级不稳定的资源。当依赖的资源出现响应时间过长后,所有对该资源的访问都会被直接拒绝,直到过了指定的时间窗口之后才重新恢复。

    3. 系统负载保护






8. Sentinel快速入门-流控规则

8.1 流控规则

流控规则:流量控制,其原理是监控应用流量的QPS(每秒查询率) 或并发线程数等指标,当达到指定的阈值时对流量进行控制,以避免被瞬时的流量高峰冲垮,从而保障应用的高可用性。

  • 资源名:唯一名称,默认是请求路径,可自定义。

  • 针对来源:指定对哪个微服务进行限流,默认指default,意思是不区分来源,全部限制。

  • 阈值类型/单机阈值:
    QPS(每秒请求数量): 当调用该接口的QPS达到阈值的时候,进行限流。
    线程数:当调用该接口的线程数达到阈值的时候,进行限流。

  • 是否集群:暂不需要集群。

8.2 关联流控

关联流控:当指定接口关联的接口达到限流条件时,开启对指定接口开启限流。

8.3 链路流控






9. Sentinel规则

9.1 流量规则

9.2 降级规则

9.3 热点规则

9.4 授权规则

9.5 系统规则

原文地址:https://www.cnblogs.com/itlihao/p/15394322.html