DELL RAID SAS5iRのリビルド

5年以上障害も無く動作していただDELLサーバーのミラーリングの片側のハードディスクが故障し、その交換を実施しました。
RAIDカードは、SAS5/iR

 早速その手順を。

前準備

同じディスクを準備、ディスクを全”0"クリアする。
※シーゲートのツール(Seagate DiscWizard)で行う。

故障状態を把握

# mpt-status -i 1
ioc0 vol_id 1 type IM, 2 phy, 298 GB, state DEGRADED, flags ENABLED
ioc0 phy 0 scsi_id 32 ATA      ST3320620NS      G   , 298 GB, state ONLINE, flags NONE
ioc0 phy 1 scsi_id 255  , 298 GB, state MISSING, flags OUT_OF_SYNC

※物理ディスクそのものが、認識していないことが判明
※注意※ この時の”phy X”の数字は、RAIDカード SAS5/iRの”SlotNum”とは違います!!間違えて正常なディスクを交換すると、全てデータがお釈迦になります。

SAS5/iRのBIOSを起動し、BIOS上で故障状態を把握


※注意※ ここで、正常なディスクは”SlotNum 1”で確認でき、故障側は空いている”SlotNum 0”と判断する

故障したディスクを交換

 ・サーバーの電源をOFFし、電源ケーブルを抜き、SAS 5/iRから出ている2本の青いSATAケーブルを確認し、”ID 0”側のディスクを交換する。
  ※注意※ 間違っても正常なディスクを交換しないこと!!
 ・サーバーの電源をONし、再度SAS5/iRのBIOSを起動する。
  ※ここで、自動でリビルド(RESYNC)になると思ったが、ならなかった。

手動でリビルドを実行

 上記画面上の”Manage Virtual Disk”を実行する。

※この画面の”Synchronize Mirror”を実行すればよいと思っていたが、選択できず。どうやら、交換したディスクが”Secandary Disk”として認識していないよう。
※”Manage Secandary Disk”を実行し、交換した側のディスクをSecandary DiskとしてYESで選択する。決して、正常側を選択しないこと。画面撮影忘れました。
※選択した瞬間、リビルドが自動でスタート

※しばらく様子をみて、5%ぐらいのところで、BIOSから抜ける。この時REBOOTがかかるがそのまま起動させる。起動画面で一瞬、SYNCしていることがわかる。

リビルド中を確認

# mpt-status -i1
ioc0 vol_id 1 type IM, 2 phy, 298 GB, state DEGRADED, flags ENABLED RESYNC_IN_PROGRESS
ioc0 phy 1 scsi_id 32 ATA      ST3320620NS      G   , 298 GB, state ONLINE, flags NONE
ioc0 phy 0 scsi_id 0 ATA      ST3320620NS      G   , 298 GB, state ONLINE, flags OUT_OF_SYNC

※リビルドしていることを確認する。
※リビルド中も通常のサービスを提供しています。

リビルド正常終了

[root@hssv1 ~]#  mpt-status -i1
ioc0 vol_id 1 type IM, 2 phy, 298 GB, state OPTIMAL, flags ENABLED
ioc0 phy 1 scsi_id 32 ATA      ST3320620NS      G   , 298 GB, state ONLINE, flags NONE
ioc0 phy 0 scsi_id 0 ATA      ST3320620NS      G   , 298 GB, state ONLINE, flags NONE

※これにて、全て正常な状態となる。320Gのディスクで、約5時間かかる。