中國IDC圈訊,開放數據中心峰會(ODCC2020)在北京召開,峰會圍繞數據中心新基建為主題,有數據中心領域及相關行業的眾多專家與會。在9月16日智能監控與管理分論壇上,中國電信股份有限公司北京分公司動環工程師翟駿發表了以《配電系統故障管理2.0》為主題的精彩演講。
我是中國電信北京公司翟駿,我們課題是《配電系統故障管理2.0》,我們2019年時新做一套網管,將原來三套老網管進行集約化收斂,新網管建立以后一直想做配電拓撲系統管理模塊,歷時大概一年時間實現了。借這次會議向大家分享配電拓撲管理模塊中的思路、建設過程以及難點。
1、項目背景
配電拓撲圖使用對象是千千萬萬一線運維人員,為什么我們做配電拓撲圖有三點原因:第一點,針對不同的局,人力配置是不同的,小型綜合通信局夜間職守只有1人情況,如果夜間出現配電告警很難實現“一人盯監控、一人去現場處理”的方式,人力相對緊缺。第二點,做運維知道了解,高壓或低壓出現告警以后往往出現關聯很多告警,比如UPS上游輸入中斷、直流系統上游輸入中斷、空調配電柜中斷,上游高壓低壓側出現告警以后,維護人員面臨的告警是多層次、多列表化的告警界面。作為運維人員需要在若干個告警中分析出根告警,從而再去機房現場進行處理。小型局站可以比較容易地找到哪個配電室、哪個閘斷了,但是針對數據中心大體量機房,上游某配電設備中斷了,全網海量告警出現后,極不利于縮短告警定位時長和告警處理時長。第三點,現場維護中主要精力70%是針對告警運維,數據中心主要分為三大塊——配電、暖通、安消防,這三者取電都是從配電中取的,如果核心側配電系統出現問題,數據中心整體的運維都會出現影響,所以配電告警占比很重。
基于此,我們希望將傳統列表式配電告警管理模式轉換成拓撲圖形式,這是兩年前給我們部門領導匯報的圖樣,紅色代表運行正常供電狀態,綠色代表分斷。比如上游401、402斷了,下游設備沒有中斷,這種情況作為一線人員看到告警肯定出現在高低壓配電室,去配電室處理就可以了。一線維護人員可以先在網管上拍張照片,拿照片直接往機房趕。所以這個項目主要涉及兩方面,一是畫圖,二是涉及系統開發。
2、設備測點數據制定
圖上要畫兩個東西,一是設備,二是測點。配電類設備要畫哪些東西?從上到下:高壓柜、變壓器、低壓柜、油機、UPS、直流、蓄電池、交流列頭柜、直流列頭柜、空調配電柜10類設備。另外,高壓柜、高壓負荷輸出柜211/221與下級低壓進線柜401/402一一對應,關聯一個就可以了,高壓負荷輸出柜不一定可以拿到測點,這種情況下我們只取低壓柜401測點即可。另外,針對電池需要不需要往圖上畫,我們認為電池往圖上畫有些冗余,因為電池是配套UPS系統進行工作,電池與UPS進行打包,一套UPS畫到圖上,上面是交流進線,下面是交流負荷輸出,上游交流進線失電了,下游UPS和直流設備正常工作,說明電池正常工作,實現了拓撲圖的功能,故我們只關注UPS上口是否斷了,不影響拓撲圖的運用。另外,我們現場調研中發現部分直流列頭柜沒有做監控,我們增補了一批電壓傳感器,主要是為了定位告警,PM表包含很多信息,很多測點并不是我們需要的,故不選用PM表。
測點如何選?針對上幾類設備主要擇選的是VBC、V23線電壓,底層網管遙測量根據閾值進行比對。低壓母連柜、高壓母連柜很難界定,國內服務器,因為現場調研發現不知道母聯柜測點掛在上口還是下口母排,所以我們取它的相電流值進行比對,只有當相電流有值時才認為母聯柜工作,拓撲圖上才可以真實變色。
3、圖怎么畫分兩類
不同于日常常見供電局打包做的配電室內設備拓撲的那么專業,我們從上到下考慮分為高壓、低壓、變壓器、UPS、直流等設備。油機及重要的UPS和直流往中間放,兩側畫空調配電柜。例如拓撲圖上部高壓配電值某個線變色的了,人員去配電室現場處理就可以了。中部UPS直流出現問題,directadmin漢化,我們進到動力機房處理就可以了。
但是大數據中心如何畫呢?我們調研了一下,北京公司既有小型的IDC,也有大型數據中心,包括亦莊瀛海、永豐數據中心和京津冀數據中心。按照拓撲圖界面承載能力來看,兩套高壓系統最多帶8臺變壓器,這種情況我們只畫UPS和直流就可以了,足以我們定位具體設備的告警原因了。
4、功能模塊的設計與應用