NFS存储迁移至GlusterFS

前提条件

为防止脑裂，建议使用最低3台节点制作3复制集的存储卷；
在进行存储迁移前，GluseterFS存储节点需先成为k8s集群中的node节点；
存储切换时请勿在平台继续操作，以免数据切换后不一致；
GluseterFS所使用磁盘挂载在/data目录，推荐使用逻辑卷；
如果之前通过修改控制器方式修改过Rainbond组件相关数据，请提前做好备份，存储切换后会重置相关修改。

部署GlusterFS

将存储节点添加至当前k8s集群，参考Rainbond官方文档安装的k8s集群扩容节点命令如下

docker exec -it kubeasz easzctl add-node NODE_IP

在k8s集群所有节点安装所需要的组件

Ubuntu16.04/18.04

add-apt-repository ppa:gluster/glusterfs-7
apt-get update
apt-get install glusterfs-client -d 
modprobe dm_thin_pool

CentOS 7

yum -y install centos-release-gluster
yum -y install glusterfs-client
modprobe dm_thin_pool

所有节点GlusterFS版本必须为7.*+，否则会出现无法挂载存储的情况；可通过执行glusterfs --version验证。

在GluseterFS节点划分分区并挂载磁盘

# 查看可用磁盘
fdisk -l
# 分区并格式化
mkfs.xfs  /dev/vdb1
mkdir  -p /data
echo "/dev/vdb1  /data  xfs  defaults 1 2" >>/etc/fstab
# 挂载
mount -a
# 确定/data挂载
df -h | grep data

以下操作在k8s集群的任一master节点执行

获取对应项目

git clone https://gitee.com/liu_shuai2573/gfs-k8s.git && cd gfs-k8s

设置标签使该节点只运行GFS

#设置标签，调度glusterfs的pod至指定节点
kubectl label node 10.10.10.71 10.10.10.72 10.10.10.73 storagenode=glusterfs
#设置taint策略，使该节点只运行glusterfs，如需复用glusterfs节点请忽略该操作
kubectl taint node 10.10.10.71 10.10.10.72 10.10.10.73 glusterfs=true:NoSchedule

运行GFS的相关控制器（视网络及性能情况而定，大约需要两分钟）

kubectl create -f gluster-daemonset.yaml

检查是否在指定节点正常运行

$ kubectl get pods -o wide --selector=glusterfs-node=daemonset
 NAME              READY   STATUS    RESTARTS   AGE    IP              NODE            NOMINATED NODE   READINESS GATES
 glusterfs-2k5rm   1/1     Running   0          52m    192.168.2.200   192.168.2.200   <none>           <none>
 glusterfs-mc6pg   1/1     Running   0          134m   192.168.2.22    192.168.2.22    <none>           <none>
 glusterfs-tgsn7   1/1     Running   0          134m   192.168.2.224   192.168.2.224   <none>           <none>

为GFS集群添加节点

kubectl exec -ti glusterfs-2k5rm gluster peer probe 192.168.2.22
kubectl exec -ti glusterfs-2k5rm gluster peer probe 192.168.2.224

#检测是否添加成功，成功则显示Connected状态
kubectl exec -ti glusterfs-2k5rm gluster peer status

创建服务账户并进行RBAC授权
```
kubectl create -f rbac.yaml
```

配置k8s集群使用GFS

创建provisioner资源

kubectl create -f deployment.yaml

创建storageclass资源

修改storageclass.yaml文件中的parameters.brickrootPaths字段对应的值，将GlusterFS节点的IP替换掉。

kubectl create -f storageclass.yaml

创建pvc验证

kubectl create -f pvc.yaml
#创建成功时STATUS为Bound
kubectl get pvc | grep gluster-simple-claim

创建pod验证

运行正常时STATUS为Running

kubectl create -f pod.yaml
kubectl get po | grep gluster-simple-pod
#验证正常后将pod删除
kubectl delete -f pod.yaml

数据备份

数据备份是考虑到实际存储切换时使用原NFS存储向GFS同步数据可能会由于受到网络因素等影响导致较慢，所以事先将NFS中的数据拷贝至手动创建的GFS存储卷中，在最终切换时再从当前的GFS卷中向切换后自动创建的卷中同步数据，需要确保GFS存储磁盘容量能够容纳以下组件的数据*2份；若实际情况NFS向GFS同步数据较快，此步骤可以忽略。

需要备份的数据如下

rbd-repo
rbd-hub
rbd-chaos
rbd-cpt-grdata

使用NFS存储的数据默认存储在NFS所运行宿主机的 /opt/rainbond/data/nfs 目录下，根据PVC名字进行划分，将上述需要备份的文件进行备份。

手动创建一个存储卷，用作备份使用

$ kubectl exec -ti glusterfs-2k5rm gluster volume create backup replica 3  192.168.2.200:/data/backup 192.168.2.22:/data/backup 192.168.2.224:/data/backup
$ gluster volume start backup

#在原NFS节点挂载该卷，方便进行备份
mkdir /backup
mount.glusterfs  192.168.2.200:/backup  /backup
#获取上述需备份数据与NFS存储中所对应的文件夹名称（对比VOLUME名字与NFS存储中文件夹名字）
kubectl get pvc -n  rbd-system
#在原NFS节点使用rsync同步数据，可进行增量备份，使用此方式备份上述四份数据
rsync -azvP /opt/rainbond/data/nfs/组件PV名字    /backup/

切换存储

删除PVC

kubectl  get pvc  -A| grep rbd-system|grep rainbondvolumerwx|awk '{print$2}'|xargs kubectl delete pvc  -n rbd-system

删除PV

kubectl get pv |grep rainbondvolumerwx|awk '{print$1}'|xargs kubectl delete pv  -n rbd-system

如遇到无法删除参考文档

修改rainbondvolume使用glusterfs存储

修改storageClassName及provisioner的值。

kubectl edit rainbondvolume -n rbd-system

spec:
  csiPlugin:
    nfs: {}
  imageRepository: registry.cn-hangzhou.aliyuncs.com/goodrain
  storageClassName: glusterfs-simple
  storageClassParameters:
    provisioner: gluster.org/glusterfs-simple
  storageRequest: 1

删除控制器

如果之前通过修改控制器方式修改过Rainbond组件相关数据，pod正常创建后需再次修改，删除后会重置相关控制器参数。

删除后将会自动创建pod及对应存储pv，pvc

kubectl delete sts nfs-provisioner rbd-eventlog rbd-db rbd-etcd rbd-monitor rbd-repo -n rbd-system
kubectl delete ds rbd-chaos rbd-gateway rbd-node  -n rbd-system
kubectl delete deploy rbd-api rbd-app-ui rbd-hub rbd-mq rbd-webcli rbd-worker  -n rbd-system

拷贝数据

查询 rbd-db，rbd-repo，rbd-hub，rbd-cpt-grdata 新创建的pv名字

kubectl get pv -n rbd-system

通过临时挂载的方式将GFS存储卷挂载出来，将之前备份的数据分别拷贝到对应目录

以 rbd-hub 为例

mkdir  /rbd-hub
mount -t glusterfs 192.168.2.187:/{rbd-hub pv名字}   /rbd-hub

拷贝完毕后重启pod识别数据

kubectl get po -n rbd-system|awk '{print$1}'|xargs kubectl delete po -n rbd-system

将平台运行组件的pv及pvc删除，并登录平台将所有应用重启

kubectl get pvc -A|grep rainbondsssc|awk '{print$1,$2}'|xargs kubectl delete pvc $2 -n $1
kubectl get pv |grep rainbondsssc|awk '{print$1}'|xargs kubectl delete pv

验证

1.查看平台组件是否都处于running状态

$ kubectl get po -n  rbd-system
NAME                                         READY   STATUS    RESTARTS   AGE
dashboard-metrics-scraper-754cdcbbb6-lkxkb   1/1     Running   0          17m
kubernetes-dashboard-57b897f8df-wjj7s        1/1     Running   0          17m
rainbond-operator-0                          2/2     Running   0          13m
rbd-api-564f456468-7gj2j                     1/1     Running   1          17m
rbd-app-ui-64c7c55995-skjsg                  1/1     Running   3          17m
rbd-chaos-gq4xg                              1/1     Running   1          17m
rbd-db-0                                     2/2     Running   2          17m
rbd-etcd-0                                   1/1     Running   1          17m
rbd-eventlog-0                               1/1     Running   1          17m
rbd-gateway-msrsd                            1/1     Running   1          17m
rbd-hub-85b7b94846-b5kp6                     1/1     Running   1          17m
rbd-monitor-0                                1/1     Running   1          17m
rbd-mq-989c5549c-qtdqj                       1/1     Running   1          17m
rbd-node-7fbqt                               1/1     Running   0          17m
rbd-node-gqc5s                               1/1     Running   1          17m
rbd-node-mg62k                               1/1     Running   0          17m
rbd-repo-0                                   1/1     Running   1          17m
rbd-webcli-84969b7fc5-bhmgs                  1/1     Running   1          17m
rbd-worker-78b6dc8fc4-cjtn6                  1/1     Running   1          17m

2.检查使用存储的组件数据是否和迁移前一致

3.找到有使用共享存储的组件，通过grctl service get命令查看是否使用的是GlusterFS存储；通过endpoints及对应路径查看数据。

$ grctl service get gr1e52a5 -t v6j1tpha
PodVolume:
+----------------+------+----------------------------------------------------------------------------------------------------------------------------------------------------------+
| Volume         | Type | Volume Mount                                                                                                                                             |
+----------------+------+----------------------------------------------------------------------------------------------------------------------------------------------------------+
| /var/lib/mysql | nfs  | endpoints: glusterfs-simple-rbd-cpt-grdata                                                                                                               |
|                |      | path: pvc-c9e702f4-2a52-4f07-98b0-25488f9b585b/tenant/6dc4f0529b8c43d7a96db742029f43d1/service/37bf4d2a3608455d867c8289231e52a5/var/lib/mysql/gr1e52a5-0 |
|                |      | endpointsNamespace: rbd-system                                                                                                                           |
+----------------+------+----------------------------------------------------------------------------------------------------------------------------------------------------------+

确认完毕后删除原NFS相关资源及数据

kubectl delete pvc data-nfs-provisioner-0 -n  rbd-system
kubectl delete pv nfs-provisioner -n  rbd-system