【Azure 微服务】记一次错误的更新Service Fabric 证书而引发的集群崩溃而只能重建

问题描述

错误的操作步骤:

1)更新Service Fabric 的证书,制定了次要证书(Secondary),但是只修改了Service Fabric Cluster证书,而没有指定VMSS(虚拟机规模集)的证书

2)在Azure Service  Fabric 的门户中的Certificates页面,点击主从切换后,发现_Node_0就Down

3)[错误步骤] 为了解决#2的问题,把当前的SF通过ARM模板重新部署了一次,导致问题严重,所有Node都Down了,这时候,Service Fabric Explorer工具还是可以打开的

4)  重启了VMSS,发现问题更加严重,Service Fabric Explorer也无法打开

问题分析

面对以上的问题,因为集群已经损坏,无法连接到Service Fabric Explorer上查看Eorror/Waining信息,所以最快的办法就是新建Service Fabric Cluster,在新建Cluster的时候同时就选择新证书。

正确的替换证书的步骤

使用ARM Teamplate修改证书:(Service Fabric, 使用ARM Template方式来更新SF集群的证书(Renew SF Certificate) 

使用PowerShell命令修改证书:(因证书过期导致Service Fabric集群挂掉(升级无法完成,节点不可用)

如果替换证书后,打开Service Fabric Explorer出现“证书无效错误”

出现该问题的原因是:

  1. 本地安装的证书与Service Fabric Explorer的域名不一致所致,但是他们的签名Thumbprint (指证书中的Thumbprint 和在SF Cluster中配置的Thumbprint )一样。
  2. 这个报错并不会影响Service Fabric 运行,可以忽略。

当在复杂的环境中面临问题,格物之道需:浊而静之徐清,安以动之徐生。 云中,恰是如此!

原文地址:https://www.cnblogs.com/lulight/p/15815146.html