2018年3月21-22日,由中國信息通信研究院主辦、中國通信標準化協會支持的"OSCAR云計算開源產業大會"在國家會議中心舉行。
銀行業云計算發展論壇作為大會分論壇之一,于22日下午召開。
李曉楓:下面請民生銀行的技術專家何佳佳給大家分享民生銀行基于開源的運維實踐。開源體系坑多,所以才把運維和開發理念合在一起,出了新詞。既然你要用開源建私有云,繞不過開源,我們聽民生銀行怎么介紹,請。
以下為演講實錄:
何佳佳:各位領導、專家,大家好,我的分享主題是民生銀行基于開源的運維實踐,其實前面幾位領導和專家都已經在云計算,包括開源方面的發展做了一些指引方面的描述,包括藍圖方面的介紹。我更多會從底層運維支撐角度來看,怎么去做云計算,包括開源的支撐。
我是03年參加工作,基本上到現在剛好分上下半場。上半場在傳統制造業,做過幾乎絕大部分IT各方面的工作,所以IT各個領域基本都有一定了解。下半場加入民生銀行,基本上做核心系統運維,包括關鍵組件的運維。這兩年更多把精力偏向工具平臺建設,包括ITIL流程,DevOps平臺建設,現在民生銀行在做實踐落地。
民生銀行是比較特殊的銀行,它是第一家民營性質全國性股份制銀行,它發展非常快,21年的歷程從最開始資本金10幾億,到現在3700億的發展速度。它有一個特點,業務與需求追求短平快,要效果,以結果為導向。所以,在這種情況下,我們會面臨哪些挑戰呢?剛才提到業務的高速發展情況,有自己的業務特色,包括它的靈活性、多樣性。再加上最近幾年互聯網金融模式,對我行的沖擊比較大,不過民生這方面應對也很及時。比如在余額寶出來之后很快對標出來如意寶。在這種業務發展情況下,從業務架構來講調整速度非常快,從而帶動底層應用架構,甚至技術架構不停的轉變和演進。同時對技術迭代要求非常高。從以前單一的開發運行框架到現在多樣化的框架,各類新技術層出不窮,比如大數據、人工智能,機器學習等等。當然,比較重要的是從封閉商業軟件模式到基于開源模式的轉變。有一個數字可以證明這些變化量,我們2017年全年所有應用變更超過1萬次,而且還在遞增。
從信息科技角度來看,2000年左右我們主要是單體應用架構。2012年到2013年之間,隨著“新”核心項目上線,改造為了SOA架構,可以從架構圖看到邏輯和應用架構的復雜性。這兩年有更大的跨度,分布式和微服務化的改造,和新技術新架構的高速演進,同時通過剛才提到的那些新技術會去引領業務,包括應用這塊的技術革新,包括的業務革新。比如,2015年開始我們有一個和發改委合作的金融云科研項目,經過2年的研究積累,我們設計實施了分布式和微服務架構方案,上線了分布式的核心系統。該系統主要采用分布式架構,也就是我們當時做的金融云科研項目的落地化。另外,新零售信貸體系,利用新興的大數據智能分析等技術,實現了決策引擎,反欺詐,貸后監測等功能,給業務帶來很大的業務革新,諸如此類的創新還有很多。
當然,這也給我們的運維帶來了一些難題。從應用架構演進到技術迭代,速度是越來越快的,而我們曾經的運維支撐能力發展相對會比較緩慢。這其中存在兩大難題,一個是傳統的運維模式,難以適應支持高速變化的應用與技術,導致運維不停的被動響應需求。另外一個是封閉的商業軟件工具依賴,需求受限,轉型緩慢不靈活,變相增加了運維的被動性,支撐能力因而發展緩慢。針對這些問題,我們也在思考如何破局。
首先,我們把視角轉向運維模式。我們最早的數據中心是傳統的組織架構,會建立很多個專業領域的中心,實現中心化管理。崗位會有明確職責,崗位之間有一定的隔離性。工具層面,包括流程層面,會和應用運維層面有比較清晰的定義。這種機制,是當時的一種比較理想的情況,但不一定適合不斷變化的環境。那怎么去改變它呢?我們考慮組織機構的“云”化。主要從三個方面解決,首先是虛擬化,我們從最痛點的應用運維入手,建立虛擬的運維小組,把崗位做業務相關性聚合分組,化整為零,通過虛擬小團隊提高靈活性,同時鼓勵跨組跨中心的輪崗。在此基礎上,建立了兩個跨中心的虛擬組,一個是流程小組,一個是工具與平臺小組。流程組會跨中心設立流程負責人,整體設計把控各種IT流程,包括問題、事件、變更等。工具與平臺小組也是多中心協同,會從實際應用場景出發,全局考慮怎么構建我們的工具和平臺。在這種虛擬化劃分的基礎上,從而做到整體扁平化管理,統一資源調配,統一工作流程,實現更有效地協同合作能力,實現全局信息共享,應用場景與工具、流程的深入融合設計。