多個(gè)機(jī)構(gòu)的調(diào)研結(jié)果顯示,企業(yè)在上云過(guò)程中會(huì)不同程度地采用多種類(lèi)型的資源池——混合云既具備公有云彈性伸縮的優(yōu)點(diǎn),又可滿(mǎn)足用戶(hù)對(duì)于不同類(lèi)型業(yè)務(wù)和數(shù)據(jù)的運(yùn)營(yíng)需求,越來(lái)越多的企業(yè)IT架構(gòu)正在逐步向多地、多點(diǎn)的混合云系統(tǒng)轉(zhuǎn)變。
一、多地、多點(diǎn)、異構(gòu)資源池網(wǎng)絡(luò)監(jiān)控難度陡增
隨著云計(jì)算新技術(shù)的不斷引入,傳統(tǒng)的網(wǎng)絡(luò)運(yùn)維、監(jiān)控方案越來(lái)越難以持續(xù),云時(shí)代的網(wǎng)絡(luò)監(jiān)控診斷遇到了新的挑戰(zhàn)。許多企業(yè)IT運(yùn)營(yíng)管理人員紛紛表示,現(xiàn)有的監(jiān)控診斷方案難以覆蓋日益增加的東西向流量;云化后的虛擬資源時(shí)刻發(fā)生變化、虛擬網(wǎng)絡(luò)的層級(jí)不斷疊加和轉(zhuǎn)換、不同業(yè)務(wù)的網(wǎng)絡(luò)服務(wù)拆分和交織在一起,網(wǎng)絡(luò)的日常運(yùn)維工作由此變得非常復(fù)雜;而當(dāng)在業(yè)務(wù)出現(xiàn)問(wèn)題時(shí),由于缺少完整的證據(jù)鏈幫助企業(yè)快速定位和排障,導(dǎo)致部門(mén)間經(jīng)常互相推諉。網(wǎng)絡(luò)“黑盒”成為企業(yè)上云的一大障礙已經(jīng)成為業(yè)界共識(shí),造成這個(gè)問(wèn)題的原因包括以下幾點(diǎn):
1. 流量管理有短板:傳統(tǒng)的分光/鏡像/采樣等技術(shù)只能覆蓋到物理網(wǎng)絡(luò),對(duì)越來(lái)越占據(jù)主導(dǎo)地位的虛擬網(wǎng)絡(luò)流量缺乏精準(zhǔn)和高效的采集手段,而后端現(xiàn)有的大部分分析工具首先缺乏必須的流量數(shù)據(jù),并且也無(wú)法處理TB級(jí)別的流量數(shù)據(jù)。
2. 網(wǎng)絡(luò)視圖不清晰:云數(shù)據(jù)中心的特點(diǎn)是各種業(yè)務(wù)由同一套系統(tǒng)承載,網(wǎng)絡(luò)資源是動(dòng)態(tài)變化的,因此很難像傳統(tǒng)網(wǎng)絡(luò)那樣用一張清晰的圖來(lái)表示云網(wǎng)絡(luò),出現(xiàn)業(yè)務(wù)故障時(shí)“虛擬網(wǎng)元”往往成為了故障盲點(diǎn),對(duì)于網(wǎng)絡(luò)中的服務(wù)互訪、關(guān)聯(lián)關(guān)系、訪問(wèn)路徑還缺少有效的監(jiān)控手段,定位故障點(diǎn)成了新挑戰(zhàn)。
3. 監(jiān)控不隨云擴(kuò)展:企業(yè)采用混合云架構(gòu)后,網(wǎng)絡(luò)結(jié)構(gòu)靈活多變,在多租戶(hù)、大量業(yè)務(wù)、海量數(shù)據(jù)的背景下,需要建立包含物理、虛擬化、容器網(wǎng)絡(luò)的統(tǒng)一監(jiān)控平臺(tái),并為其他部門(mén)提供網(wǎng)絡(luò)分流、數(shù)據(jù)服務(wù)。
二、用DeepFlow構(gòu)建業(yè)務(wù)全鏈路流量知識(shí)圖譜
許多行業(yè)有明確的等保要求,例如必須有能力對(duì)虛擬網(wǎng)絡(luò)的拓?fù)浜土髁窟M(jìn)行采集和展現(xiàn),采集方式也必須確保安全可靠。企業(yè)想徹底解決虛擬網(wǎng)絡(luò)“黑盒”問(wèn)題,則需要獲取完整的網(wǎng)絡(luò)流量。下面以DeepFlow全景圖功能為例,介紹混合云環(huán)境下的網(wǎng)絡(luò)流量采集及全鏈路監(jiān)控。
全景圖是DeepFlow重要功能之一,v5.6版本提供十多個(gè)維度(包括IP、VPC、子網(wǎng)、區(qū)域、可用區(qū)、宿主機(jī)、虛擬機(jī)、容器節(jié)點(diǎn)、容器POD、業(yè)務(wù)、資源組等)的資源流量搜索和知識(shí)圖譜展現(xiàn),以及云網(wǎng)全景視圖下的監(jiān)控診斷解決方案。幫助用戶(hù)將網(wǎng)絡(luò)信息、資源信息、服務(wù)信息與業(yè)務(wù)信息有機(jī)關(guān)聯(lián),統(tǒng)一采集并分發(fā)任意工作負(fù)載(容器/虛擬機(jī))之間的流量,實(shí)現(xiàn)對(duì)業(yè)務(wù)網(wǎng)絡(luò)的全面性能監(jiān)控。流量搜索從十余個(gè)維度的資源視角展示網(wǎng)絡(luò)性能監(jiān)控?cái)?shù)據(jù)。全景圖展示的視角(頁(yè)面)包括:
流統(tǒng)計(jì):以IP五元組聚合流,以流屬性為基礎(chǔ)統(tǒng)計(jì)吞吐、負(fù)載、時(shí)延、性能、異常及流量屬性數(shù)據(jù),支持以趨勢(shì)、排名、分布、拓?fù)涞姆绞竭M(jìn)行可視化。
包統(tǒng)計(jì):以IP二元組聚合,對(duì)包的播送類(lèi)型、TCP標(biāo)志位、TTL、包長(zhǎng)區(qū)間等屬性進(jìn)行吞吐量統(tǒng)計(jì),支持以趨勢(shì)、排名、分布、拓?fù)涞姆绞竭M(jìn)行可視化。
廣域網(wǎng):從地理位置的視角展示資源與Internet之間的流量分布,支持以中國(guó)省份維度進(jìn)行分組統(tǒng)計(jì),支持的指標(biāo)量與流統(tǒng)計(jì)相同,支持以趨勢(shì)、排名、分布的方式進(jìn)行可視化。
通過(guò)點(diǎn)擊拓?fù)渲械墓?jié)點(diǎn)、路徑,云服務(wù)器租用,以及分布圖中的分組,用戶(hù)可在上述頁(yè)面之間進(jìn)行切換,從不同的視角對(duì)同樣的數(shù)據(jù)進(jìn)行展現(xiàn)。另外,頁(yè)面還可進(jìn)一步跳轉(zhuǎn)到流量曲線二級(jí)頁(yè)面,以折線圖的視角,展現(xiàn)現(xiàn)拓?fù)渲械墓?jié)點(diǎn)、路徑或分布圖中分組的統(tǒng)計(jì)數(shù)據(jù)在不同時(shí)間的結(jié)果,并與虛擬機(jī)、容器POD的啟停、創(chuàng)建(同步)、刪除、遷移、IP變更事件進(jìn)行關(guān)聯(lián)展示。進(jìn)一步的,可以跳轉(zhuǎn)到流日志三級(jí)頁(yè)面,查看對(duì)應(yīng)的原始流日志詳細(xì)信息。
DeepFlow全景圖功能下目前有流量搜索及網(wǎng)絡(luò)拓?fù)鋬蓚€(gè)子功能,流量搜索聚焦于從不同的維度對(duì)虛擬網(wǎng)絡(luò)中的流量指標(biāo)數(shù)據(jù)(500多個(gè)監(jiān)控指標(biāo))進(jìn)行靈活檢索,形成豐富多樣的子視圖(拓?fù)漕?lèi)、比較類(lèi)、分布類(lèi)、趨勢(shì)類(lèi)等),對(duì)流量數(shù)據(jù)進(jìn)行可視化展現(xiàn)。且所有可視化圖表均可加入自定義視圖中進(jìn)行進(jìn)一步的組合、設(shè)置告警生成策略、設(shè)置報(bào)表生成策略。