布萊恩·阿瑟在《技術(shù)的本質(zhì)》中寫道:“在真實世界中,技術(shù)是高度可重構(gòu)的,它們是流動的東西,永遠不會靜止,永遠不會完結(jié),永遠不會完美。 ”
技術(shù)的進化則如如同達爾文在《進化論》中提到的:“自然選擇是進化的動力。”數(shù)據(jù)中心進化的動力,則是一種“幸福的煩惱”。
今天的數(shù)據(jù)中心行業(yè)發(fā)展正面臨前所未有的復(fù)雜環(huán)境,網(wǎng)絡(luò)應(yīng)用種類和數(shù)量的極大豐富催生了海量數(shù)據(jù),據(jù)IDC預(yù)測10年增長達到20倍以上,到2025年達到180ZB。在此背景下,作為數(shù)字經(jīng)濟基礎(chǔ)的“數(shù)據(jù)中心”面臨著巨大的挑戰(zhàn)。
越是復(fù)雜的需求,越給了智能化以發(fā)展的空間。在數(shù)據(jù)中心向智能進化的過程中,AI驅(qū)動的計算、存儲和網(wǎng)絡(luò)的自動化優(yōu)化和智慧運營以及AI驅(qū)動的巡檢機器人等,都是當(dāng)前數(shù)據(jù)中心智能化所產(chǎn)生的新需求。
那么對于數(shù)據(jù)中心網(wǎng)絡(luò)而言,在云和AI的時代背景下,要如何實現(xiàn)智能進化?
智能時代
數(shù)據(jù)中心網(wǎng)絡(luò)的挑戰(zhàn)與方向
我們知道,隨著數(shù)字經(jīng)濟時代的到來,算力成為了一個根本要素,數(shù)據(jù)中心成為了數(shù)字經(jīng)濟的支撐。在數(shù)據(jù)中心當(dāng)中,計算固然重要,但同樣需要強有力的網(wǎng)絡(luò)保證數(shù)據(jù)不丟包,讓每一分算力都發(fā)揮到最大的價值。
尤其隨著5G、云和AI等技術(shù)的與應(yīng)用相結(jié)合,為數(shù)據(jù)中心帶來巨大的沖擊。數(shù)據(jù)中心網(wǎng)絡(luò)也面臨著數(shù)據(jù)浪涌式10倍增長、數(shù)據(jù)丟包導(dǎo)致算力損失、業(yè)務(wù)TTM(產(chǎn)品上市周期)和故障修復(fù)時間長等一系列挑戰(zhàn)。
華為數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域總裁王雷指出,“在數(shù)據(jù)中心內(nèi),網(wǎng)絡(luò)連接計算和存儲資源,但需求因場景的不同也有其獨特的要求。例如業(yè)務(wù)希望網(wǎng)絡(luò)能夠?qū)崿F(xiàn)規(guī)模彈性擴展,但是對丟包/時延不敏感;存儲災(zāi)備場景需要網(wǎng)絡(luò)能夠?qū)崿F(xiàn)本地和同城長距離傳輸均不丟包;而高性能計算場景則需要網(wǎng)絡(luò)能夠?qū)崿F(xiàn)零丟包,低時延。”
由此可見,數(shù)據(jù)中心網(wǎng)絡(luò)要解決最大的難題,就是在各種業(yè)務(wù)場景下做到0丟包率。然而,這在數(shù)據(jù)中心網(wǎng)絡(luò)以太化的發(fā)展中,卻變得異常艱難。
一方面,數(shù)據(jù)中心網(wǎng)絡(luò)全以太化演進方向似乎不可逆轉(zhuǎn)。由于IT架構(gòu)從集中式走向分布式,大規(guī)模節(jié)點互聯(lián)已成為以太網(wǎng)的天下;同時,計算單元都在去PCIE總線,突破總線的速率瓶頸,而存儲介質(zhì)向全閃存升級,帶寬高達400GE的以太網(wǎng)成為新一代存儲網(wǎng)絡(luò)的事實標準。
另一方面,以太網(wǎng)的屬性天然就會丟包,隨著網(wǎng)絡(luò)規(guī)模的增加,丟包率仍呈指數(shù)級增長。尤其在存儲同城雙活場景中,由于長距傳輸帶來的額外數(shù)百微秒的時延,讓網(wǎng)絡(luò)流控實現(xiàn)零丟包更是雪上加霜。
解決這些問題的關(guān)鍵,就是智能化。其實這也是華為推出了CloudFabric 3.0數(shù)據(jù)中心網(wǎng)絡(luò)的意義所在,通過網(wǎng)絡(luò)智能管控系統(tǒng)iMasterNCE、以及CloudEngine數(shù)據(jù)中心交換機兩大部件,滿足數(shù)據(jù)中心網(wǎng)絡(luò)在各種不同應(yīng)用場景下的0丟包和智能化運維。
無疑CloudFabric 3.0正在開啟數(shù)據(jù)中心網(wǎng)絡(luò)的智能化時代。
云南移動數(shù)據(jù)中心網(wǎng)絡(luò)轉(zhuǎn)型之后的“三升三降”
對運營商而言,5G浪潮之下的數(shù)據(jù)中心網(wǎng)絡(luò),需要更高效,更敏捷地支撐業(yè)務(wù)變革。云南移動就通過網(wǎng)絡(luò)智能化,支撐了IT業(yè)務(wù)變革的典范。
為了更好地融入數(shù)字經(jīng)濟,云南省提出了“數(shù)字云南”戰(zhàn)略,隨著新基建加速發(fā)展,云南移動積極布局5G。截止2020年底,云南移動在全省范圍內(nèi)已共計建成18萬余基站;云南移動的服務(wù)對象覆蓋近四千萬個人用戶,一千萬家庭用戶,四十多萬的政企用戶以及數(shù)十個全新平臺。
業(yè)務(wù)的迅速增長,顯然也給云南移動的數(shù)據(jù)中心網(wǎng)絡(luò)的建設(shè)提出了更高的要求。
比如云南移動的BOSS系統(tǒng)月計單數(shù)在2020年,達到了一千億條,比16年增長了10倍,服務(wù)器需求也從2018年的3千臺增加到2021年的1萬臺,這些系統(tǒng)的增長對數(shù)據(jù)中心網(wǎng)絡(luò),都是極大的挑戰(zhàn)。
同時,云南移動的數(shù)據(jù)中心,分布在玉溪、昆明、曲靖三個城市,業(yè)務(wù)各自部署,是傳統(tǒng)的煙囪式架構(gòu),傳統(tǒng)網(wǎng)絡(luò)出故障幾率大,人工維護很低效,這也給云南移動的業(yè)務(wù)創(chuàng)新制造了不少的麻煩。
因此,云南移動決定選擇部署華為CloudFabric 3.0數(shù)據(jù)中心方案來解決上述難題。
據(jù)了解,在與華為的聯(lián)合解決方案當(dāng)中,云南移動通過一套網(wǎng)絡(luò)管理系統(tǒng)納管全省多個數(shù)據(jù)中心,支持跨100公里業(yè)務(wù)平滑遷移與彈性擴縮,打破空間與地域限制。并基于CloudEngine數(shù)據(jù)中心交換機構(gòu)建100GE無損高速互聯(lián),滿足高性能計算與存儲要求。同時,基于方案提供的智能化管理能力,業(yè)務(wù)部署周期從周縮短到分鐘級,7多種網(wǎng)絡(luò)故障可實現(xiàn)實時感知與智能修復(fù),大幅提升運維效率。
總結(jié)起來,云南移動的數(shù)據(jù)中心網(wǎng)絡(luò)解決方案落地后的收益可概括為“三升三降”: