另外有五個中心,物理中心和互聯(lián)網(wǎng)數(shù)據(jù)中心不一樣,大量的邏輯交易、核心交易都會放在物理中心,傳統(tǒng)數(shù)據(jù)中心跟它不一樣。所以我們跟BAT相比,我們大型主機一臺設(shè)備幾十億,但是我們也要發(fā)展X86。我去幫助營口銀行規(guī)劃方向,85%的系統(tǒng)都上云了,非常不錯。
13日上午,IDCC2018分論壇,數(shù)據(jù)中心技術(shù)創(chuàng)新論壇正式召開!本次論壇邀請了行業(yè)內(nèi)知名大咖和技術(shù)專家為大家?guī)懋?dāng)今數(shù)據(jù)中心技術(shù)創(chuàng)新內(nèi)容的分享。
前面兩位,海峰老總加上德昌老總介紹了IDC的管理情況,特別是IDC的發(fā)展情況。德昌講到了DCIM系統(tǒng),他們在銀行里推了200多家DCIM系統(tǒng),非常不錯。剛才講的是怎么降低成本,這是關(guān)鍵,我也是經(jīng)過研究,在銀行搞IT30多年時間,老說銀行是安全性、可靠性很重要,這是跑不了的。
中國IDC圈訊 12月11日-13日,由中國IDC產(chǎn)業(yè)年度大典組委會主辦,中國IDC圈、CloudBest承辦的以“賦能企業(yè)數(shù)字化轉(zhuǎn)型”為主題的第十三屆中國IDC產(chǎn)業(yè)年度大典(簡稱“IDCC2018”)在北京國家會議中心隆重召開。
AI現(xiàn)在很火,現(xiàn)在我們搞智能的東西有100家公司,真正有幾家公司實現(xiàn)了智能化?大家知道智能化的8個場景是必須有的,分析、判斷、處理這些是必要的。做數(shù)據(jù)中心運維還是要適應(yīng)新技術(shù),管理經(jīng)驗千金不換。這里南征北戰(zhàn)有句話可以借用,智能化就像大炮只能解決面上的問題,要像步兵一樣解決實際戰(zhàn)斗還得靠運維的實踐經(jīng)驗。
我們編了1800多個應(yīng)急預(yù)案,都是來自于這些系統(tǒng)方面的,把這些都放在系統(tǒng)里,比如說遭到攻擊、斷了等等都有預(yù)案,還有一些信息破壞,包括戰(zhàn)爭災(zāi)害,我們都有預(yù)期預(yù)案。
我一般就看三個圖:系統(tǒng)邏輯圖、物理布置圖、業(yè)務(wù)流向圖,這樣才能落地,這本書的含義大概就是這樣,今天因為時間有限,講得不好,有意義的大家聽進去,沒意義的就一笑了之,謝謝。
還有處置場所,還有服務(wù)受理場所,技術(shù)分析場所也都是需要的,以及演練,特別是演練以后要模擬。應(yīng)急管理技術(shù)實踐有哪些呢?主動運維是很重要的理論,書里面也說得很清楚,免備案空間 香港服務(wù)器,是可靠性為先的主動性維護,對TCO整個成本來說會降低。什么叫TCO?里面有三個成本。一個是資本之需,這是必要的,買設(shè)備。還有運維之需,包括培訓(xùn)安裝。還有機會成本,就是故障發(fā)生了之后,做得正不正確。
現(xiàn)在銀行業(yè)比較大,這是去年的數(shù)字,數(shù)據(jù)中心幼43萬個,發(fā)展得非常快,但是我們增長的速度跟美國的增長速度相比要大,每年快10%左右。但是中國IDC規(guī)模不及美國的1/4,IDC的發(fā)展還有30年的時間,特別是5G來了以后,隨著萬物互聯(lián),不光是搞超大數(shù)據(jù)中心,以后就近下載信息數(shù)據(jù)的時候,可能邊緣計算就出來了。十年以前我就說要有邊緣計算,現(xiàn)在已經(jīng)出來了,理論和基礎(chǔ)都出來了。
資本成本是30%,運維成本占50%,機會成本將近15%,舉個例子,你們買個汽車,比如說20萬,但是20萬只占30%,還有70%是在運維成本和機會成本里。你撞車就是機會成本,不撞車就沒用,你撞車買保險提高,所以機會成本要降低,這是很重要的一個方面。
但是現(xiàn)在機房越來越大,成本也要關(guān)注了。機柜每年要耗費1億左右,特別是北京的電費是988,現(xiàn)在銀行利潤也比較薄,特別是這些大銀行,每年增長一個點就非常不錯了,5%以下,以前銀行利潤是百分之幾十,所以不能一味考慮安全性、可靠性,同時要考慮成本。剛才德昌說了,我們要向成本進發(fā),今天在座的都是關(guān)注IDC建設(shè)運維的。
我們有8億筆交易量,如果應(yīng)急管理做得不好,或者網(wǎng)絡(luò)崩潰、電源崩潰、系統(tǒng)崩潰、宕機,你怎么能快一些?特別是要速度快、范圍廣、程度大,有可能銀行就要破產(chǎn),一旦科技體系崩潰,這個銀行肯定完蛋,如果災(zāi)備做得不好,應(yīng)急做得不好肯定完蛋。
我搞了個管理框架,應(yīng)急管理體系的模型是通過5年研究出來的,應(yīng)急預(yù)案和應(yīng)急演練一定要做,為什么呢?我是海軍出身,我是無線電的臺長,我管電臺車,在山里架天線,把發(fā)電機打開,3分鐘的時間要跟北京通話,要演練。里面很多應(yīng)急響應(yīng),現(xiàn)狀評估、差距分析、改進計劃、實施改進,這是一個閉環(huán)。
事前、事中、事后書里都有,應(yīng)急管理也要有三打紀律、八項原則。由于自動化監(jiān)控,發(fā)現(xiàn)異常不瞞報,發(fā)現(xiàn)問題不推諉,這些書上都有。還有一些基本管理,一些聯(lián)動措施。現(xiàn)在銀行跟外面的聯(lián)系非常多,你跟電力打交道,跟運營商打交道,域名注冊,跟各個廠商打交道,有很多聯(lián)系,不是個孤島。還有基本管理,建立一些升級方式、溝通機制。光外部接觸的公司就有一千多個,包括跟股票市場、運營商等等打交道,都有溝通機制。
應(yīng)急管理是這樣的情況,要完成制度的編寫,把制度編完了,這些都要有。這個模型是很重要的,我們作為IDC集團有一套角色定位,沒有角色不好處理,我們要有很多角色做落地。還有事件級別范圍,有長時間要定下來。還有應(yīng)急場所,我們有云端桌面,有顯示系統(tǒng),有電話系統(tǒng),這些場所都是離不開的。還有一些監(jiān)控的東西,自動化監(jiān)控也是很重要的,有問題要自動暴出來。
它的目標(biāo)是什么?作為IDC來講要快速、有效、有序。怎么能有效?大量的預(yù)案,還有覆蓋率。我做了1800個預(yù)案,做完之后就是優(yōu)秀的工程師了,有序處理,不能一團亂麻。
還有銀行數(shù)據(jù)中心搞IDC,數(shù)據(jù)中心要是宕機就完蛋了,所以要活著,活著是銀行的本領(lǐng),而且還要活得更好。什么叫活得更好?體驗、效率、效益。體驗不好、效率不好、效益不好,都沒戲,但是網(wǎng)絡(luò)帶寬要好。所以怎么做?這都是我們需要考慮的。
還有傳統(tǒng)運維管理和主動性運維不一樣,我們怎么降低機會成本,降低運維成本,是很重要的。一個車20萬,運維成本要花30萬,要買很多保險,做維護。
到了中午,大家比較困,確實知識量比較大,但是沒關(guān)系,還有提神的時候。這本書馬上要新發(fā)了,大家需要的話可以去簽,IDC準備的量不少,聽說有100多本。兩本,姊妹書。
在應(yīng)急管理方面,銀監(jiān)會突發(fā)事件應(yīng)急處置工作小組2016年有這樣的要求,把常態(tài)應(yīng)急管理和非常態(tài)應(yīng)急處置結(jié)合起來,使事件盡量不轉(zhuǎn)化為突發(fā)事件或小事不變成大事,最大限度劃界不和諧因素,歷史驗證和現(xiàn)實表明,應(yīng)急管理工作不可能一蹴而就,要持之以恒,久久為功,才能發(fā)揮重要作用。
應(yīng)急管理離不開四個平臺:應(yīng)急預(yù)案管理平臺、應(yīng)急協(xié)作管理平臺、運維流程管理平臺、集中監(jiān)控管理平臺。怎么把它結(jié)合起來,也是考驗我們功夫的。
《應(yīng)急管理在銀行的策略》這本書就出來了,管什么?怎么管?所有的系統(tǒng),所有的環(huán)境,所有的運行,就管這些東西。怎么管?以前都是靠人去管,當(dāng)然人是很重要的,可能我們要創(chuàng)新一些管理體系,扎實一些邏輯還有一些目標(biāo)為導(dǎo)向,去智能化、自動化的發(fā)展,這是一個策略和方向。
特別是5G,急需要邊緣計算的出現(xiàn),很多小數(shù)據(jù)中心分在各地發(fā)展,因為路徑太長了,傳輸太貴了,可了不得。20年以前我在中國銀行管全球2千萬的電信租賃費,現(xiàn)在是20億,10倍的價格增長,所以要考慮成本。
現(xiàn)在銀行業(yè)比較大,當(dāng)然大不過雙十一的交易量,但是銀行是金融交易量,現(xiàn)在有8億筆。現(xiàn)在世界上最大的銀行在中國,交易量很大,摩根史丹利、花旗銀行肯定沒有中農(nóng)共建交易量大。
應(yīng)急協(xié)作管理平臺,內(nèi)外怎么協(xié)作,怎么打通外部和內(nèi)部,和運維中心和軟件中心的協(xié)作關(guān)系。還有流程平臺,要把所有流程自動化,這個很關(guān)鍵,我們的桌面里可以看到,來監(jiān)控,事件來了怎么處置。還有監(jiān)控平臺,事情出來以后也是打通的,這四個平臺都是相通的,這是我們自動化的系統(tǒng)。
我舉了一個例子,比如說個人理財WAS節(jié)點無法連接,9:12出現(xiàn)的,9:14啟動應(yīng)急,9:30找到應(yīng)急預(yù)案,9:35業(yè)務(wù)驗證,得到解決,我們用了23分鐘,很快,這是真實的案例,如果你不解決的話,產(chǎn)生銷售不出去,銀行理財產(chǎn)品是上百億的銷售,這個影響很大。事黑怎么處置,這都是很清楚的,是一套邏輯范圍。書里有189個預(yù)案在里面,你看了之后就知道怎么干活,非常管用,告訴你怎么做應(yīng)急預(yù)案。
我們結(jié)合實際要做好數(shù)據(jù)運維,下面就進入主題,前面是鋪墊。應(yīng)急管理很重要,剛才海峰老總說,銀行隨著信息的散布,有30分鐘以上的邏輯系統(tǒng)當(dāng)即必須實名報委員會,面對面的匯報,30分鐘以下的要做電話報備。所以很多應(yīng)急管理怎么做?比如說地震、洪水、海嘯都有應(yīng)急管理。金融市場變化,9·11的時候很多銀行就破產(chǎn)了,但是很多恢復(fù)得很快,也沒什么影響。
會上,ODCC金融專家組專家 原中國銀行數(shù)據(jù)中心副總經(jīng)理楊志國為大家?guī)砹恕稇?yīng)急管理在銀行業(yè)數(shù)據(jù)中心的策略與實踐》的主題演講。以下為演講實錄(未經(jīng)本人核實):