恢复vSAN健康状况_参考网

恢复vSAN健康状况

2018-11-09

网络安全和信息化 2018年5期

关键词：群集磁盘可用性

故障现象

一个2节点的vSAN延伸群集，节点主机配置了 1个CPU、16GB内存、1块万兆网卡、2个磁盘组组成2节点直连的vSAN延伸群集。在使用一段时间之后，其中一个节点主机出现问题，管理员进入控制台将这个主机进行了“系统重置”，重置之后，再次进入控制台，将IP地址、密码设置为与原来相同。登录vSphere Web Client重新连接、配置主机之后，在“配置→磁盘管理”中看到，这台主机磁盘组的“vSAN健康状况”为-（如图 1），同时，在“网络分区组”列表中，这台主机没有分区信息。

图1 vSAN健康状态不正常

图2 vSAN健康状态正常

正常情况下的“vSAN健康状况”应该显示为“正常”（如图2）。

此时当前的vSAN数据存储容量降为原来的一半。

解决故障一

1.解决思路

对于出现图1所示状态的故障，解决的思路如下。

（1）如果当前vSAN群集中有正在运行的虚拟机，重要的虚拟机可以备份或迁移到其他群集中继续运行。不太重要的虚拟机，可以暂时先关闭。

（2）禁用 HA。

（3）将出故障的主机进入维护模式（当前主机是172.18.96.36），并从 vSAN群集中移除。

（4）将172.18.96.36重新加入vSAN群集，并退出维护模式。

（5）重新启用HA。

2.解决步骤

下面介绍详细步骤。

（1）在导航器中选中vSAN群集（当前群集名称为T630-vSAN），在右侧单击“配置→故障域和延伸群集”，在“故障域/主机”中可以看到，当前缺少“首选”主机（或缺少辅助主机）。

（2）在“配置 → 服务→vSphere可用性”中单击“编辑”按钮。

（3）在打开的“编辑群集设置”对话框的“vSphere可用性”中，取消“打开vSphere HA”的选择然后单击“确定”按钮。

（4）在vSphere导航器中，将故障主机进入维护模式，然后将其移除。移除完成之后如图3所示。

（5）将故障主机再次加入群集，并将故障主机退出维护模式。

（6）在“配置→vSAN→故障域和延伸群集”中单击+号按钮（如图4）。

图3 移除故障主机之后

图4 添加故障域

图5 故障域信息正常

（7）在“新建故障域”对话框中的“名称”文本框中为新添加的故障域设置缺失的故障域名称。根据图4所示，当前缺失“首选”故障域，故设置名称为首选，选中再次添加的主机172.18.96.36，单击“确定”按钮。

（8）添加故障域之后，如图5所示。

（9）为 172.18.96.36的主机启用SSH服务，使用xshell登录到172.18.96.36，执行如下命令，为在vmk0添加vSAN见证流量。

esxcli vsan network ip add -i vmk0 -T=witness

（10）在“配置→vSAN→磁盘管理”中，可以看到172.18.96.36的主机磁盘组正常。

（11）在“数据存储→数据存储”中可以看到容量恢复正常（当前为3.68TB）。

（12）在“配置→vSphere可用性”中，启用vSphere HA。

故障解决二

在重新添加节点主机之后见证主机可能出错，这表示为在“配置→磁盘管理”中的“网络分区组”中，见证主机没有分组信息，vSAN健康状况显示为-。

对于这种问题，只要更改见证主机，并重新选择见证主机即可解决。

（1）在“配置→vSAN→故障域和延伸群集”中单击“更改见证主机”。

（2）在“更改见证主机”对话框的“选择见证主机”选项中，仍然选择原来的见证主机172.18.96.39即可。

（3）重新选择见证主机之后，整个vSAN群集恢复正常，在“网络分区组”中可以看到每个节点主机及见证主机都在组1，vSAN健康状况为正常。

猜你喜欢

群集磁盘可用性

叶腊石聚合成型及其旋转磁盘的制作方法

基于辐射传输模型的GOCI晨昏时段数据的可用性分析

Cecilia Chiang, pioneer of Chinese cuisine

它的好　它的坏　详解动态磁盘

带群集耗散项的零压流方程的扰动黎曼问题

解决Windows磁盘签名冲突

从可用性角度分析精密空调的配电形式

Windows系统下动态磁盘卷的分析与研究

医疗器械的可用性工程浅析

高稳定被动群集车联网连通性研究

网络安全和信息化

网络安全和信息化的其它文章