本节只介绍双盘失效问题处理案例。三盘及以上盘失效请联系研发处理。
· 本操作方法只适应于RAID失效且该RAID中所有的LUN全部失效的情况。
1. 查看RAID类型,确认RAID状态、LUN状态以及失效硬盘的槽位号和时间点。
登录OSM管理界面,找到告警ID为 900 的告警:硬盘失效,记录硬盘失效的时间点及先后顺序,如下图:可知(0,8)槽位硬盘先失效,(0,4)槽位硬盘后失效(此项一定要记正确,顺序记反,会导致数据丢失)。
图2
图3
通过后台登录至Cli模式,输入 showrg 获取RAID的ID、类型和状态,输入showlun 获取LUN的ID和状态以及LUN归属的RAID,如下图:其中RAID1的类型为RAID5,状态为fault(失效),其所属的LUN状态全部为失效。
图4
2. 确认硬盘的物理状态和逻辑状态。
通过后台登录至CLI模式,输入showdisk –l 和 showdisk –p 分别获取硬盘的逻辑状态和物理状态,如下图:(0,4)(0,8)逻辑状态为fault,物理状态为nomal。
图5
图6
3. 修复RAID为降级状态。
a. 修复最后失效的硬盘为normal状态。
进入mml命令模式下面,通过(revive disk 框号 槽位号)命令操作恢复后失效的硬盘,如下图后失效的为(0,4)槽位硬盘。注意:如果(0,4)槽位的硬盘物理状态为fault,需要先拔插一下该槽位的硬盘使其物理状态恢复为normal(查看方法同showdisk –p )。
b. 修复所有的LUN为normal状态,RAID为降级状态。
c. 修复完硬盘之后,通过(revive raidlun RAID-ID)命令继续修复所有的LUN为normal,然后退出到cli模式查看RAID的状态会变为降级状态(Degrade)。
图7
图8
d. 确认修复完成。
,exit 到cli模式,重新查看最先失效的硬盘的状态是否为重构状态(Reconstruction is in process),如果为重构状态则修复完成,如下图(0,8)槽位硬盘的状态为重构状态。
图9
如果硬盘的状态不为重构状态,为Fault状态,如下图:
图10
当出现Fault状态时:
· fault时,需要对该槽位的硬盘进行拔插操作(拔和插间隔15s以上),拔插后硬盘会进入
双盘失效解决方案 来自淘豆网m.daumloan.com转载请标明出处.