數據中心交換機是網絡的重要組成部分,網絡從接入到核心基本均采用的是交換機。
現在很多新技術和應用都要依賴網絡,對交換機也提出了更高的要求,那些傳統的二三層轉發交換機已無法滿足業務需求,交換機必須做出改變。在2017年第四季度,全球交換機的市場達到了69億美元,預計到2019年,全球交換機市場能超過250億美元,這依然是一個不能讓人忽視的市場,所以很多交換機大廠都在挖空心思設計未來的網絡設備,寄希望在未來的市場競爭中脫穎而出。
要說現在最火的技術,當屬人工智能AI技術,通過AI技術來模仿人的行為,從而代替人自動完成人的工作。AI技術已經滲透到很多行業中,也包括數據中心。作為數據中心組成中最為重要的一份子,交換機自然不能缺席。將AI技術引入網絡,在交換機上實踐是一個很棒的設計,而且已經有人已經開做著手做了。那么,AI究竟能給交換機帶來什么呢?本文將展開說明。
1.流量分析
數據中心里海量的數據是其寶貴的財富,利用大數據對數據流量進行分析,云服務器租用,往往能得到一些非常有價值的分析結果。交換機作為數據流量轉發的載體,能夠接觸到最全面的數據,所以針對這些數據進行分析,非常有意義
。其實,早已經有不少的分析設備和軟件可以做這個事情,比如:流量清洗設備,防火墻,入侵檢測,上網流量行為分析等等,這些往往是在交換機上做鏡像或者采樣技術將流量復制一份到分析設備,有分析設備完成分析,輸出分析結果。這樣一方面增加采購分析設備成本,另一方面是分析比較初級,更多是側重于安全過濾與防護,若交換機自己就具備這樣的功能豈不更好?交換機的CPU本身是比較弱的,但也可以單獨增加一個CPU,或者干脆將一個服務器裝入交換機,讓其完成流量分析工作。
這樣擁有了強大的計算能力就可以部署AI技術,通過AI技術可以很快掌握交換機上的流量轉發情況,還可以輸出很多流量分析結果供管理人員參考。同時AI技術還可以將設備的各種運行參數監控起來,綜合評判分析當前交換機的工作狀態,若處于非健康狀態及時給出告警和調整建議。
2.算法優化
交換機為了提升轉發效率,很多算法都是比較初級的,比如路由最長匹配,聚合HASH算法,算法本身都不復雜,可以提升硬件轉發數據的效率,本質上是硬件處理不夠靈活。有了AI技術,就可以根據交換機上的數據轉發情況,自學習設計算法,對于效率不高的算法進行優化,然后將算法固化到硬件中去。現在的SDN就是這樣的理念,通過軟件來學習網絡互聯狀態,然后學習完成后,向各個網絡設備下發轉發流表,控制器就是整個網絡的大腦,這個大腦擁有AI技術,具備學習能力,通過對整個網絡進行學習,逐漸實現自動化管理整個網絡。通過每個交換機都部署上AI技術,最終整個網絡都是AI的,完全走向自動化運行的網絡。
3.閾值設計
交換機里有大量的定時器和閾值設計,這些閾值很多都是經驗性的,并無標準可言,很多時候并不適用于所有網絡,所以我們會看到交換機上有上千條的命令,通過設置不同命令來滿足不同網絡環境的需求。比如OSPF的Hello報文超時時間我們可以配置成10*3秒,可以配置成1*3秒,ARP老化時間可以配置成20分鐘,也可以配成1分鐘,在不同的網絡環境中可以采用不同的閾值參數,站群服務器,這需要在設備上做大量的配置工作,每一次網絡變更都需要在設備上輸入大量的配置命令,有了AI交換機則完全不同了。
AI交換機不需要做這些配置,先會設置一個默認的初始值,然后會根據網絡情況有時會調整這個閾值參數,這個閾值參數也并不是一成不變的,隨著網絡的波動也在不斷變化著,這樣極大簡化了設備的配置量。AI交換機幾乎不需要人參與做配置,而是根據網絡互連情況自動下發最適合的閾值,大大提升了網絡運維的效率,將繁瑣的判斷過程交給AI去做,當然AI會根據大量的歷史經驗數據計算得來,讓閾值參數最符合網絡當前的情況。在交換機內部實現上也有很多地方采用閾值變量進行判斷,這些地方其實都可以通過AI技術實現,將AI實現的源代碼嵌入到交換機程序中,對涉及閾值參數的地方進行AI計算,得到更加合理的閾值參數。
4.故障自愈
交換機不僅要完成數據轉發,還要在發生故障的時候能夠自愈,如果能夠做到這點,數據中心網絡自動化的運維,就可以成真,要完全做到這個是很難的,因為很多時候經驗豐富的工程師都很難短時間找到問題原因,這樣故障恢復的手段都難以確定。