SpringCloud-Hystrix:服务熔断与降级

什么是Hystrix?

​ Hystrix是一个用于处理分布式系统的延迟和容错的开源库,在分布式系统里,许多依赖不可避免的会调用失败,比如超时,异常等,Hystrix能够保证在一个依赖出现问题的情况下,不会导致整体服务失败,避免级联故障,以提高分布式系统的弹性。

​ “断路器”本身是一种开关设置,当某个服务单元发生故障之后,通过断路器的故障监控(类似熔断保险丝),向调用方法返回一个服务预期的,可处理的备选响应(FallBack),而不是长时间的等待或者抛出调用方法无法处理的异常,这样就可以保证了服务调用方的线程不会被长时间,不必要的占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩。

​ 那么Hystrix能够做一些什么呢?

  • 服务降级
  • 服务熔断
  • 服务限流
  • 实时监控

以及一些分流,依赖分离之类等等。这里我们将用简单的介绍服务熔断和降级,并用代码简单演示一下。

服务熔断

什么是服务熔断?

举个例子解释,生活中每家每户都在用电,小明家的电线因为故障导致了小明家停电了。而小李、小张家的电是正常使用的。电力公司没有因为小明家有故障线路而停掉其他人家的电,同时小明家没有使用有故障的电路的电。这时即为熔断。熔断的目的是当A服务模块中的某块程序出现故障后为了不影响其他客户端的请求而做出的及时回应。

熔断是应对雪崩效应(如上,如果不停掉小明家的电,万一故障波及到了其他家)的一种微服务链路保护机制。

当扇出链路的某个微服务不可用或者响应实践太长时,会进行服务的降级,进而熔断该节点微服务的调用,快速返回错误的响应信息。当检测到该节点微服务调用响应正常后恢复调用链路。在SpringCloud框架里熔断机制通过Hystrix实现。Hystrix会监控微服务间调用的状况,当失败的调用到一定的阈值,缺省是5秒内20次调用失败就会启动熔断机制。熔断机制的注解是HystrixCommand

实现方式呢我们用注解简单演示一下,不代表实际开发

不可避免的我们需要导入依赖,我们在我们的服务提供方(服务端)导入依赖,同时在主启动类开启服务

        <dependency>
            <groupId>org.springframework.cloud</groupId>
            <artifactId>spring-cloud-starter-hystrix</artifactId>
            <version>1.4.6.RELEASE</version>
        </dependency>

package com.lin.springcloud;

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.client.circuitbreaker.EnableCircuitBreaker;
import org.springframework.cloud.client.discovery.EnableDiscoveryClient;
import org.springframework.cloud.netflix.eureka.EnableEurekaClient;

//启动类注解
@SpringBootApplication
//在服务启动后自动注册到服务中心
@EnableEurekaClient
@EnableDiscoveryClient //服务发现
@EnableCircuitBreaker  //添加对熔断的支持
public class UserProvider_hystrix {
    public static void main(String[] args) {
        SpringApplication.run(UserProvider_hystrix.class,args);
    }
}

我们使用注解的方式

package com.lin.springcloud.controller;


import com.lin.springcloud.pojo.User;
import com.lin.springcloud.service.UserService;
import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RestController;

import java.util.List;

@RestController
public class UserController {

    @Autowired
    UserService userService;

    @PostMapping("/user/add")
    public boolean addUser(User user){
        return userService.addUser(user);
    }

    //使用注解方式来调用熔断方法
    @HystrixCommand(fallbackMethod = "hystrixGet")
    @GetMapping("/user/get/{id}")
    public User queryUserById(@PathVariable(value = "id") int id){
        User user = userService.queryUserById(id);
        if(user == null) throw new RuntimeException("该id"+id+"查找不到用户");
        return userService.queryUserById(id);
    }

    @GetMapping("/user/list")
    public List<User> queryListUser(){
        return userService.queryListUser();
    }


    //熔断处理的备选方法
    public User hystrixGet(@PathVariable("id") int id){
        return new User()
                .setId(id)
                .setName("该id"+id+"查找不到用户!")
                .setDb_source("无该数据库");
    }

}

我们的数据库只有5位用户,id最大也只到了5,如果查询6的话,我们是查询不到的,而且是会抛出错误的,而且前台也会有500错误。但是用了熔断之后呢,我们前台还是可以正常显示的

 
 

这里呢我们只是以这个例子来体现一下熔断的机制,实际上我们如果我们正常处理这种为空的现象不管是后台处理还是异步回调都很简单,但是如果不处理呢却是会让我们的服务器出现问题。而熔断就是用来处理更大更容易雪崩的现象。

服务降级

服务降级是什么呢?

举个例子解释,我们去银行排队办理业务,大部分的银行分为普通窗口、特殊窗口(VIP窗口,老年窗口)。某一天银行大厅排普通窗口的人巨多。这时特殊窗口贴出告示说某时刻之后再开放。那么这时特殊窗口的工作人员就可以空出来去帮其他窗口办理业务,提高办事效率,已达到解决普通窗口排队的人过的目的。这时即为降级,降级的目的是为了解决整体项目的压力,而牺牲掉某一服务模块而采取的措施。

 
 

这里我们同样以代码简单演示一下

我们在我们Feign的封装接口那里调用fallbackFactory的实现类

package com.lin.springcloud.service;

import com.lin.springcloud.pojo.User;
import org.springframework.cloud.openfeign.FeignClient;
import org.springframework.stereotype.Component;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.PathVariable;
import org.springframework.web.bind.annotation.PostMapping;

import java.util.List;

@Component
//调用我们的实现的fallbackFactory的实现类
@FeignClient(value = "SPRINGCLOUD-PROVIDER",fallbackFactory = UserFeignServiceFallbackFactory.class)
public interface UserFeignService {

    @PostMapping("/user/add")
    public boolean addUser(User user);

    @GetMapping("/user/get/{id}")
    public User queryUserById(@PathVariable(value = "id") int id);

    @GetMapping("/user/list")
    public List<User> queryListUser();

}

实现类这里呢,我们只对一个方法做了处理,因为只是仅仅为了演示

package com.lin.springcloud.service;

import com.lin.springcloud.pojo.User;
import feign.hystrix.FallbackFactory;
import org.springframework.stereotype.Component;

import java.util.List;

@Component
public class UserFeignServiceFallbackFactory implements FallbackFactory {
    @Override
    public Object create(Throwable throwable) {
        return new UserFeignService() {
            @Override
            public boolean addUser(User user) {
                return false;
            }

            @Override
            public User queryUserById(int id) {
                return new User()
                        .setId(id)
                        .setName("目前服务不可用!服务降级演示")
                        .setDb_source("no data_source");
            }

            @Override
            public List<User> queryListUser() {
                return null;
            }
        };
    }
}

在我们的服务消费客户端开启Hystrix

server:
  port: 80

#Eureka配置
eureka:
  client:
    register-with-eureka: false #不向Eureka注册自己
    service-url:
      defaultZone: http://eureka-7001:7001/eureka/,http://eureka-7002:7002/eureka/,http://eureka-7003:7003/eureka/
#开启Hystrix
feign:
  hystrix:
    enabled: true

然后我们启动我们的服务提供服务端,注册中心,还有我们的服务消费客户端

首先我们是可以正常访问的

 
 

但是这个时候我们因为其他服务器的访问请求太大,我们这边的请求特别少,所以我们打算空出服务器来减缓其他服务器的压力。为了测试,我们把提供服务的服务器关闭,那我们这个时候的请求还能访问吗?是可以访问的,因为我们做了服务降级,会访问到我们的降级处理

 
 

熔断与降级的异同

相同之处:

  • 目的很一致,都是从可用性可靠性着想,为防止系统的整体缓慢甚至崩溃,采用的技术手段;
  • 最终表现类似,对于两者来说,最终让用户体验到的是某些功能暂时不可达或不可用;
  • 粒度一般都是服务级别,当然,业界也有不少更细粒度的做法,比如做到数据持久层(允许查询,不允许增删改);
  • 自治性要求很高,熔断模式一般都是服务基于策略的自动触发,降级虽说可人工干预,但在微服务架构下,完全靠人显然不可能,开关预置、配置中心都是必要手段;

区别之处:

  • 触发原因不太一样,服务熔断一般是某个服务(下游服务)故障引起,而服务降级一般是从整体负荷考虑;

  • 管理目标的层次不太一样,熔断其实是一个框架级的处理,每个微服务都需要(无层级之分),而降级一般需要对业务有层级之分(比如降级一般是从最外围服务开始)

本文有参考自
服务的熔断和降级的区别
谈谈我对服务熔断、服务降级的理解

 
 

2人点赞

 
 

作者:CryFace
链接:https://www.jianshu.com/p/01efebbfc269