SpringCloud 网飞系转换阿里系1

前言：

　　由于目前网飞系的停更，国内阿里系微服务生态的大火，考虑到将来社区的活跃度，在这次公司级的微服务选型我选择了springcloud alibaba生态。结合原有netflix的架构做一个本地预研。

目前预研进度：

　　1.只保留原有组件库下的common、log、restful（swagger3,exception fallback）、feign（含各个微服务的feignClient）与 netflix相关的及数据库缓存等解耦先不引入后续基础框架成型后一次引入。本次我们重点关注放在分布式注册中心、配置中心及服务间的调用。

　　2.注册中心由Eureka 配置中心由apollo 替换成alibaba-nacos

　　3.路由网关由zuul-gateway 替换成spring自己的springcloud-gateway，此时nacos本身已实现默认的ribbon负载均衡策略。

　　4.服务间的调用沿用feign+ribbon，相对alibaba-dubbo的上手复杂度及性价比,综合考虑团队及业务体量，仍然选用前者。

　　5.微服务的高可用性主角担当（限流与熔断）将hystrix替换成alibaba-sentinel 。满眼都是sentinel的优点。方法级的细颗粒度控制、搭配直观的控制平台、极易可读api、实时查看实时修改的规则。相对hystrix简单粗暴的针对一个微服务做信号量或线程数的配置。前者显得更加的人性化。值得一提，生产环境下的sentinel使用必须做到配置规则持久化这是一个大前提。

　　6.sleuth+zipkin 分布式调用链追踪

　　7.未完待续：既然决定了全面拥抱阿里巴巴生态，当然不能放过一些已有的优秀组件。

　　服务级：分布式事务seata、任务调度服务Alibaba Cloud SchedulerX、消息中间件rocketmq的封装

　　业务级：Alibaba Cloud OSS: 阿里云对象存储服务、Alibaba Cloud SMS: 覆盖全球的短信服务（ps啥时候把自己的支付业务也集成开源下）

遇到的坑：

　　1.1 Nacos作为注册中心，swagger2升级3中间遇到的问题难点

　　　　a.gateway路由总入口对下属各个服务的命名空间的获取

　　　　b.swagger3页面对微服务调用无法带上命名空间的问题处理

　　　　通过接口的源码追踪可以发现swagger3内对页面渲染时没有带上微服务的命名空间。

　　由于swagger3没有开放这部分的重写接口，只能用同包名同类名的方法加@Primary注解强制替换

效果

　　2.1 Nacos部署服务注册配置中心引用

　　　　a. 服务注册时gateway和其他微服务需要在相同的命名空间

　　　　b. 配置中心可以区分环境、项目等隔离，nacos配置中心可以指定dataId grou

　　4.1 feign ribbon的配置及优化

　　　　a. feign httpClient启用

　　　　b. 压缩优化，主要针对文件上传的情况

　　　　c.ribbon负载均衡的超时问题

　　　　　　先说结论：1.在没有做好幂等工作情况下，禁用feign跟ribbon两个重试机制。

　　　　　　　　　　　2.如果需要开启重试机制，超时时间（重试）必须小于熔断时间，否则直接熔断不触发重试。

　　　　　　　　　　　　Feign重试和Ribbon重试

　　　　　　　　　　　　feign自身重试目前只有一个简单的实现Retryer.Default，包含三个属性：maxAttempts：重试次数，包含第一次 period：重试初始间隔时间，单位毫秒 maxPeriod：重试最大间隔时间，单位毫秒

　　　　　　　　　　　　ribbon重试包含两个属性：MaxAutoRetries和MaxAutoRetriesNextServer

　　　　　　　　　　　　总重试次数= 访问的服务器数 * 单台服务器最大重试次数，即：（1+MaxAutoRetriesNextServer）*（1+MaxAutoRetries ）

　　　　　　　　　　　　超时时间设置

　　　　　　　　　　　　feign和ribbon的超时时间只会有一个生效，规则:如果没有设置过feign超时，也就是等于默认值的时候，就会读取ribbon的配置，使用ribbon的超时时间和重试设置。否则使用feign自身的设置。两者是二选一的，且feign优先。

优化后

　　以上述的配置为例如果要开启重试机制，此时sentinel对order-api的熔断时间必须要大于3*（1+2）*（1+2） = 18秒否则提前进入熔断后续无法重试

　　5.1 sentinel部署资源的简单使用

　　　　a. 在配置资源到sentinel以后，达到sentinel的触发阈值默认是抛出异常。如果增加blockHandler或者fallbackHandler将进入方法块（可理解为捕获异常），如未抛出自定义业务异常将继续向下执行。

　　　　b.sentinel的配置数据默认存储是memory方式，也就是说随着微服务节点的重启，声明的资源虽然能直接初始化还在簇点链路，但是对应的限流、熔断配置将清空。（ps这还得了几百个的规则重新配置谁受得了）

　　5.2 sentinel持久化到nacos，sentinel与nacos的双向同步改造

　　　　a.引入sentinel-datasource-nacos，微服务在启动时读取nacos的配置文件（专门为sentinel五个规则增加配置文件单独获取），自动的加载到sentinel。（ps感觉还是有点麻烦，那不是每次都要在nacos里面写配置几百个照样很累人啊。。继续寻找解决途径）

　　　　b. 对sentinel源码下手，双向同步改造，增加对sentinel规则的监听在sentinel簇点增加规则同时，将规则配置同步更新到对应nacos的配置文件（注意这里配置文件命名规范要一致，不然找不到会新建一个新的）（ps这下舒服了，既可以在sentinel方便的增加规则并同步到nacos配置，又可以线上更新nacos的规则实时同步到sentinel）

　　　　参考 https://blog.csdn.net/weixin_40816738/article/details/119453019

　　　　也可以直接下载我已经上传的git仓库 https://gitee.com/xuetieqi/sentinel-nacos.git

　　5.3 对feignClient资源的sentinel使用

　　　　a. 开启feign对sentinel的支持，此时将会扫描所有feignClinet并将特定规则的资源命名加到簇点链路同步到sentinel，不需要手动声明@SentinelResource

　　5.4 sentinel异常统一拦截处理（不再增加冗余的fallbackHandler和blockHandler），同学们只要声明@SentinelResource即可（静态资源手动声明，feign资源自动已经声明全部在sentinel簇点链路下可以查看然后增加配置）

　　5.5 ps因为绝大部分的feignClient基本都要加一次熔断规则，每次在sentinel里面的簇点节点增加貌似也有点不方便。希望可以启动时默认扫描所有feignClient根据上面提到的资源命名规则自动推送一份默认的限流熔断规则到sentinel。那么同学们就只需要关注到本身业务的限流熔断。

未完待续

SpringCloud 网飞系 转换阿里系1

SpringCloud 网飞系转换阿里系1