布萊恩·阿瑟在《技術的本質》中寫道:“在真實世界中,技術是高度可重構的,它們是流動的東西,永遠不會靜止,永遠不會完結,永遠不會完美。 ”
技術的進化則如如同達爾文在《進化論》中提到的:“自然選擇是進化的動力。”數據中心進化的動力,則是一種“幸福的煩惱”。
今天的數據中心行業發展正面臨前所未有的復雜環境,網絡應用種類和數量的極大豐富催生了海量數據,據IDC預測10年增長達到20倍以上,到2025年達到180ZB。在此背景下,作為數字經濟基礎的“數據中心”面臨著巨大的挑戰。
越是復雜的需求,越給了智能化以發展的空間。在數據中心向智能進化的過程中,AI驅動的計算、存儲和網絡的自動化優化和智慧運營以及AI驅動的巡檢機器人等,都是當前數據中心智能化所產生的新需求。
那么對于數據中心網絡而言,在云和AI的時代背景下,要如何實現智能進化?
智能時代
數據中心網絡的挑戰與方向
我們知道,隨著數字經濟時代的到來,算力成為了一個根本要素,數據中心成為了數字經濟的支撐。在數據中心當中,計算固然重要,但同樣需要強有力的網絡保證數據不丟包,讓每一分算力都發揮到最大的價值。
尤其隨著5G、云和AI等技術的與應用相結合,為數據中心帶來巨大的沖擊。數據中心網絡也面臨著數據浪涌式10倍增長、數據丟包導致算力損失、業務TTM(產品上市周期)和故障修復時間長等一系列挑戰。
華為數據中心網絡領域總裁王雷指出,“在數據中心內,網絡連接計算和存儲資源,但需求因場景的不同也有其獨特的要求。例如業務希望網絡能夠實現規模彈性擴展,但是對丟包/時延不敏感;存儲災備場景需要網絡能夠實現本地和同城長距離傳輸均不丟包;而高性能計算場景則需要網絡能夠實現零丟包,低時延。”
由此可見,數據中心網絡要解決最大的難題,就是在各種業務場景下做到0丟包率。然而,這在數據中心網絡以太化的發展中,卻變得異常艱難。
一方面,數據中心網絡全以太化演進方向似乎不可逆轉。由于IT架構從集中式走向分布式,大規模節點互聯已成為以太網的天下;同時,計算單元都在去PCIE總線,突破總線的速率瓶頸,而存儲介質向全閃存升級,帶寬高達400GE的以太網成為新一代存儲網絡的事實標準。
另一方面,以太網的屬性天然就會丟包,隨著網絡規模的增加,丟包率仍呈指數級增長。尤其在存儲同城雙活場景中,由于長距傳輸帶來的額外數百微秒的時延,讓網絡流控實現零丟包更是雪上加霜。
解決這些問題的關鍵,就是智能化。其實這也是華為推出了CloudFabric 3.0數據中心網絡的意義所在,通過網絡智能管控系統iMasterNCE、以及CloudEngine數據中心交換機兩大部件,滿足數據中心網絡在各種不同應用場景下的0丟包和智能化運維。
無疑CloudFabric 3.0正在開啟數據中心網絡的智能化時代。
云南移動數據中心網絡轉型之后的“三升三降”
對運營商而言,5G浪潮之下的數據中心網絡,需要更高效,更敏捷地支撐業務變革。云南移動就通過網絡智能化,支撐了IT業務變革的典范。
為了更好地融入數字經濟,云南省提出了“數字云南”戰略,隨著新基建加速發展,云南移動積極布局5G。截止2020年底,云南移動在全省范圍內已共計建成18萬余基站;云南移動的服務對象覆蓋近四千萬個人用戶,一千萬家庭用戶,四十多萬的政企用戶以及數十個全新平臺。
業務的迅速增長,顯然也給云南移動的數據中心網絡的建設提出了更高的要求。
比如云南移動的BOSS系統月計單數在2020年,達到了一千億條,比16年增長了10倍,服務器需求也從2018年的3千臺增加到2021年的1萬臺,這些系統的增長對數據中心網絡,都是極大的挑戰。
同時,云南移動的數據中心,分布在玉溪、昆明、曲靖三個城市,業務各自部署,是傳統的煙囪式架構,傳統網絡出故障幾率大,人工維護很低效,這也給云南移動的業務創新制造了不少的麻煩。
因此,云南移動決定選擇部署華為CloudFabric 3.0數據中心方案來解決上述難題。
據了解,在與華為的聯合解決方案當中,云南移動通過一套網絡管理系統納管全省多個數據中心,支持跨100公里業務平滑遷移與彈性擴縮,打破空間與地域限制。并基于CloudEngine數據中心交換機構建100GE無損高速互聯,滿足高性能計算與存儲要求。同時,基于方案提供的智能化管理能力,業務部署周期從周縮短到分鐘級,7多種網絡故障可實現實時感知與智能修復,大幅提升運維效率。
總結起來,云南移動的數據中心網絡解決方案落地后的收益可概括為“三升三降”: