一個完整的數據中心機房,每日都應該做些什麼來進行維護

一個完整的數據中心機房除了有主要的網絡設備與機櫃之外,想要正常的運轉還離不開工作人員每日的維護,那麼,數據中心機房的日常維護都包括哪些東西呢?數據中心的日常工作主要包含值班、巡檢、設備維護保養,故障處理、演練等。

一個完整的數據中心機房,每日都應該做些什麼來進行維護

值班,每個數據中心都有一套動環系統,這套監控系統監控著數據中心裡所有的設備,採集成千上萬個點,比如電壓、電流、頻率、PUU、功率、溫溼度等各種信息都可以從這個系統中讀出,而且每個參數都設定有一定的範圍,超過這個範圍值系統就會告警,屏幕相應位置會閃爍,且有語音提示,這是值班的人就需要對相應的問題進行現場處理,因為對每個故障都有處理的時限,因此值班人員需要對位置進行快速定位,所以要求值班人員對機房的所有設備的位置非常熟悉才行。

一個完整的數據中心機房,每日都應該做些什麼來進行維護

日常的巡檢,就是對不同的設備有不同的巡檢頻率要求,巡檢就是拿著巡檢記錄本去機房進行巡查,有點類似於大王派我來巡山的感覺,對有問題的點進行處理,然後記錄在案。

設備維護保養,每個機房都列有詳細的設備維護保養計劃,具體到每天做什麼,對哪些設備具體做什麼具體的維護保養,這個維護週期都是以月為單位的,不斷的週期循環。

演練,演練的目的是為了提高大家對應急情況的處理能力,我們的演練包含了各種故障情況,比如斷電、斷水、設備故障、防恐、防洪、防颱風等,演練主要是模擬真實應急狀況發生,我們依據現有的應急預案能夠完美的應對當時的情況,為了完成這個演練我們需要準備很多資料,比如演練計劃、演練方案、應急預案、演練報告等,每次演練前都會進行各種部署,事後進行總結反思。

一個完整的數據中心機房,每日都應該做些什麼來進行維護

故障處理,機房設備很多,難免會出現一些故障,這時就需要有經驗的工程師去現場解決問題,我們一般分為一線工程師,二線專家,在一線工程師無法解決問題的時候,向二線專家尋求幫助,如果二線專家也搞不定,就只能向設備廠家尋求幫助了。

以上這些都是機房運行一些最基本的工作,是保證機房運行的最基本的要求,除了這些還有很多事務性的工作,比如和客戶溝通、節能減排、其他一些專項工作等,總體上來說,運維的工作並不是技術性很強的工作,但涉及的面較多,而且容不得有一點失誤,不光是為了業務中不中斷,裡面的高壓電也非常危險,所以需要非常規範的流程來減少大家的失誤,提高我們的工作效率和滿足較高的要求。


分享到:


相關文章: