【转】Proxmox系统替换zfs中的坏盘并重建/恢复阵列

平台正在用的一块zfs硬盘坏了,需要换一块新硬盘,过程中参考proxmox的官方文档以及一些相应的资料,整理了一下步骤如下。

欢迎大家批评指正


zfs系统替换硬盘的基本步骤

使用zpool status 命令查看zfs存储池情况

1
zpool status

可以看到第二个硬盘的相关分区出现了faulted,导致整个zfs出现了严重的io delay,zfs的状态为degraded

使用zpool offline 命令使坏盘脱机(可选)

1
zpool offline ata-WDC_WD2002FYPS-02W3B0_WD-WCAVY6573998-part3

结果如下图所示,报错分区状态变为offline。

更换硬盘并初始化

移除要替换的硬盘并插入新的硬盘。打开proxmox GUI 选择相应的node,打开disk界面,确认新硬盘被识别,并使用GPT进行初始化。

有些情况下可能需要关机后才能移除硬盘,这时如果重新启动时出现“failed to import zfs名”的报错,那么解决方案如下:
1.开机进入boot选项后,按“e”键,进入编辑模式,在quiet前加入“rootdelay=35”,再按“ctrl+x”键进入。
2.进入系统后,可以修改grub在quiet前加入rootdelay=35,修改后长期有效

运行zpool replace命令

这里由于硬盘识别id实在太长了就不打了,仅附上proxmox wiki中的两种对应的替换方案。

1.直接更换设备,如果热插拔使得新旧设备id相同,则可以直接省略“new device”。

1
zpool replace -f <pool<old device<new device>

2.更换分区

1
2
3
4
5
sgdisk <healthy bootable device-R <new device>
sgdisk -G <new device>
zpool replace -f <pool<old zfs partition<new zfs partition>
pve-efiboot-tool format <new disk‘s ESP>
pve-efiboot-tool init <new disk’s ESP>

replacing的时间比较长,也不太好停止,可以使用zpool status查看相应进度。一般情况下,replace完了之后会直接online,如果没有如此就运行zpool online命令即可。

小插曲,我换的过程中一不留神用磁盘直接替换了对应分区,目前一切良好,看上去只要替换对象的存量比原来的大都不会出问题。

原文地址:https://www.cnblogs.com/surplus/p/14054907.html