springcloud微服务总结五 服务熔断

一:雪崩效应

如下图所示:A作为服务提供者,B为A的服务消费者,C和D是B的服务消费者。A不可用引起了B的不可用,并将不可用像滚雪球一样放大到C和D时,导致整个系统瘫痪,雪崩效应就形成了。

20180519182935328.png

 

雪崩过程:

1:由于网路或其他原因(硬件故障、程序Bug、用户大量请求)A服务变得不可用,A服务的不可用导致B服务会出现线程的长阻塞,此时如果有大量的请求涌入(用户重试加大流量),B服务servlet容器线程资源会被消耗完毕。大量请求的积压,直接导致B服务变慢,最终瘫痪

2:B服务瘫痪的瘫痪同理会导致C、D服务的瘫痪,最后导致系统瘫痪

二:防雪崩利器

怎么防止雪崩效应的发生呢? 

解决问题方案:对依赖做隔离,Hystrix就是处理依赖隔离的框架,同时也是可以帮我们做依赖服务的治理和监控

依赖隔离分为两种,第一种线程池隔离(Thread-pool Rejection),第二种信号量隔离(semaphre Rejection)

 

b90615c1-f7cb-3cf1-9bf3-de11d5f57697.png

 

 

a):线程隔离

    首先:容器线程(tomcat、jetty)与   远程服务调用线程隔离,即异步执行服务间远程调用      

    其次:如果依赖多个微服务,多个依赖间相互隔离

    线上建议线程池不要设置过大,否则大量堵塞线程有可能会拖慢服务器。

线程隔离的优点:

        可以完全模拟异步调用,方便异步编程。

线程隔离的缺点:

        线程开销

线程隔离的适用场景

       不受信服务(第三方接口服务)

        有限依赖(依赖的服务不能太多)

NOTE: 

Netflix公司内部认为线程隔离开销足够小,不会造成重大的成本或性能的影响。Netflix 内部API 每天100亿的HystrixCommand依赖请求使用线程隔,每个应用大约40多个线程池,每个线程池大约5-20个线程。

b):信号隔离

      信号隔离也可以用于限制并发访问,防止阻塞扩散, 与线程隔离最大不同在于执行依赖代码的线程依然是请求线程(该线程需要通过信号申请),

   如果客户端是可信的且可以快速返回,可以使用信号隔离替换线程隔离,降低开销.

信号隔离优点

       轻量,无额外开销

信号隔离缺点

        不支持异步调用

信号隔离的适用场景

      

        受信服务(公司内部服务)

        高依赖(网关)

三:HYSTRIX

a)hystrix简介

所谓的熔断机制和日常生活中见到电路保险丝是非常相似的,当出现了问题之后,保险丝会自动烧断,以保护我们的电器,程序中我们也可以借用这个思想,使用Hystrix实现程序的熔断。

719930-20170903171704624-1917697781.png

 

hystrix对应的中文名字是“豪猪”,豪猪周身长满了刺,能保护自己不受天敌的伤害,代表了一种防御机制,这与hystrix本身的功能不谋而合,因此Netflix团队将该框架命名为Hystrix,并使用了对应的卡通形象做作为logo。

b)Hystrix快速体验

Hystrix熔断限流主要埋在客户端,所以只需要在服务消费者方集成Hystrix。集成了Hystrix的客户端,我们一般称为Hystrix客户端

1:pom依赖

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId> spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>

2:启动类加@EnableCircuitBreaker

3:fallback逻辑

 
import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import com.wendao.provider.consumer.pojo.User;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.http.ResponseEntity;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.client.RestTemplate;
  
@RestController
public class ConsumerController {
  
 
    @Autowired
    private RestTemplate restTemplate;
 
    @HystrixCommand(fallbackMethod = "fallback")
    @RequestMapping("/findOne")
    public User findOne(){
        User user = restTemplate.getForObject("http://SPRING-CLOUD-SERVICE-PROVIDER/user/1", User.class);
 
        return user;
    }
 
    //fallback逻辑
    private User fallback(){
 
        //TODO ....
        return new User("fallback",12);
    }
  
}

4:测试

关闭服务提供者,测试结果如下:

image.png

说明:

1:请求服务提供者失败,怎么样算失败呢?

答:请求超时(默认1秒)算请求失败,不一定是服务提供者没启动,即使服务提供者启动,但是响应慢,超过了超时时间,一样请求失败。

可以通过下面方式设置超时时间

@HystrixCommand(fallbackMethod = "fallback",commandProperties = {
    @HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="5000")
})

2:服务提供者请求失败,会调用fallback逻辑,立即给客户端响应,这种情况叫服务降级

四:服务熔断

@RestController
public class ConsumerController {
  
 
    @Autowired
    private RestTemplate restTemplate;
 
    @HystrixCommand(fallbackMethod = "fallback",commandProperties = {
        @HystrixProperty(name = "circuitBreaker.enabled",value="true"),
        @HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value="10"),
        @HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value="10000"),
        @HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value="50"),
    })
    @RequestMapping("/findOne")
    public User findOne(){
        //如果熔断器开启是不会进入这个方法的,直接调用fallback逻辑
        System.out.println("come in");
        User user = restTemplate.getForObject("http://SPRING-CLOUD-SERVICE-PROVIDER/user/1", User.class);
 
        return user;
    }
 
    //fallback逻辑
    private User fallback(){
 
        //TODO ....
        return new User("fallback",12);
    }
  
}

刚开始你会发现打印come in ,说明主逻辑方法还是执行了,还是发送了请求,只不过请求失败,执行了fallback逻辑,这个时候只是服务降级。

一旦调用失败次数过大就会导致熔断器开启,熔断器如果open,那么就不可能让你继续执行主逻辑方法了,这时候fallback就成了主逻辑方法

五:熔断器状态机

其实上面演示的不是熔断,熔断器根本没开启,上面演示的只是服务降级。真正的熔断器开启是要满足一定条件【阈值】,才会开启熔断器。

image.png

 快照时间窗:断路器确定是否打开需要统计一些请求和错误数据,而统计的时间范围就是快照时间窗,默认为最近的10秒。

  请求总数下限:在快照时间窗内,必须满足请求总数下限才有资格根据熔断。默认为20,意味着在10秒内,如果该hystrix命令的调用此时不足20次,即时所有的请求都超时或其他原因失败,断路器都不会打开。

circuitBreaker.requestVolumeThreshold

    错误百分比下限:当请求总数在快照时间窗内超过了下限,比如发生了30次调用,如果在这30次调用中,有16次发生了超时异常,也就是超过50%的错误百分比,在默认设定50%下限情况下,这时候就会将断路器打开。

circuitBreaker.errorThresholdPercentage

当熔断器在10秒内发现请求总数超过20,并且错误百分比超过50%,这个时候熔断器打开。打开之后,再有请求调用的时候,将不会调用主逻辑,而是直接调用降级逻辑,通过断路器,实现了自动地发现错误并将降级逻辑切换为主逻辑,减少响应延迟的效果。

在断路器打开之后,处理逻辑并没有结束,我们的降级逻辑已经被成了主逻辑,那么原来的主逻辑要如何恢复呢?对于这一问题,hystrix也为我们实现了自动恢复功能。当断路器打开,对主逻辑进行熔断之后,hystrix会启动一个休眠时间窗,在这个时间窗内,降级逻辑是临时的成为主逻辑,当休眠时间窗到期,断路器将进入半开状态,释放一次请求到原来的主逻辑上,如果此次请求正常返回,那么断路器将继续闭合,主逻辑恢复,如果这次请求依然有问题,断路器继续进入打开状态,休眠时间窗重新计时。

六 feign对hystrix的支持

feign只能服务降级,无法进行服务熔断,这个是我个人了解道德

使用方法:

在aplication。properties文件中添加配置:

feign.hystrix.enabled=true

创建熔断类这个类是实现调用服务的那个接口的实现类:

@Component//不能忘记加上该注解
public class UserBizImpl implements IUserbiz {
    @Override
    public Map update(User user) {
        return new HashMap();
    }
 
}

再修改feign客户端:

@FeignClient(value="spring-cloud-service-provider",fallback = UserBizImpl.class)

这样就可以了

原文地址:https://www.cnblogs.com/xiufengchen/p/10430547.html