◎Dell MD3200 Storage故障與狀況排除紀錄

由於上周六學校斷電,恢復供電後昨天發現MD3200的燈號異常,機殼辨識Enclosure status LED的橘色燈號不斷閃爍,但功能與使用上卻不受影響,如下圖所示…

IMG_5428-480


IMG_5429-480

查了一下手冊,Enclosure status LED燈號代表的狀況有五種定義

1.The enclosure status LED lights when the enclosure power is on.
2.Lights blue during normal operation.
3.Blinks blue when a host server is identifying the enclosure or when the system identification button is pressed.
4.Lights amber as enclosure boots or is reset.
5.Blinks amber when the enclosure is either in a fault state or the hosts are not using the preferred path to a virtual disk.

橘燈閃爍的情況屬於第五種,肇發原因是Raid Controller與主機或虛擬磁碟失聯,或是虛擬磁碟原先設定指向的Controller路徑/順序因斷電造成錯誤,回想一下斷電與復電後的流程,在市電中斷後是直接撐到UPS電力耗盡為止,當市電恢復後,MD3200電力恢復,但Server卻是等到我周日上午到校才開機。因此,異常原因應該是指Controller與Host失聯,進到MDSM確認Disk Group prefer path正常,MD3200(給AD用)以及Virtual Machine(給ESXi用)這兩個Disk Group的prefer path都指向Raid Controller Module in Slot0-online,但是橘燈還是閃爍不停,把Log清掉狀況仍舊無法排除。

01

02

不得已只好聯繫Dell技術支援,PowerVault儲存設備是周一到周日24h全天服務,號碼是國際免付費電話(0080開頭而不是0800喔),電話為0080-1601-256,聽到語音按2選中文,再按3即可。(客服人員跟HP一樣,都有著濃濃的鄉音,習慣用語也容易聽唔)。在接通後須提供機器序號讓對方確認,但想到機櫃塞得滿滿的要把序號抄下來實在不容易,幸好客服人員葉Sir告知從MDSM裏頭撈資料亦可,開啟MDSM之後在Summary標籤中點選Storage Array Profile,從ALL當中搜尋Service tag就可以撈到。

03

接著我把狀況描述給客服知悉後,從MDSM/Advance/Suport Data/Collect將Log匯出並寄給工程師分析…

04

匯出是zip檔,內容我也看不懂…

05

工程師在看完Log之後回覆設備正常,參照來信指示將設備依序重啟再觀察狀況是否排除。

06

所以趕緊用內線廣播告知即將停機,請仍在加班的同仁預做準備,依指示操作後就恢復正常了,這次停機時間由16:45~17:00,因為是下班後處理,所以影響範圍不大。

發表留言