IT 監(jiān)控和管理傳統(tǒng)上一直專注于企業(yè)的 IT 主干;例如,其數(shù)據(jù)中心、服務(wù)器、網(wǎng)絡(luò)等。然而,如今,隨著越來越多的員工在家工作,客戶或合作伙伴分散在世界各地,組織都發(fā)現(xiàn)監(jiān)控和管理擴(kuò)展網(wǎng)絡(luò)連接以確保為員工、客戶或合作伙伴提供卓越的數(shù)字體驗(yàn)。
綜合監(jiān)控是越來越多的組織采用的一種方法,通過模擬用戶請(qǐng)求來主動(dòng)監(jiān)控網(wǎng)站、Web 服務(wù)或應(yīng)用程序的數(shù)字體驗(yàn),以驗(yàn)證系統(tǒng)可用性和性能。在我們的“馴服 IT 混亂”博客系列的第三篇文章中,我們將介紹綜合監(jiān)控技術(shù)以及機(jī)器學(xué)習(xí)分析如何增強(qiáng)它。
不同粒度的綜合監(jiān)控
綜合監(jiān)控可以應(yīng)用于不同的粒度——從站點(diǎn)級(jí)別到應(yīng)用程序級(jí)別再到單個(gè)用戶級(jí)別。對(duì)于分布在多個(gè)位置的組織,綜合監(jiān)控的一個(gè)選項(xiàng)是在其每個(gè)位置部署基于代理的軟件。通過利用簡(jiǎn)單的技術(shù)(如 Ping 測(cè)試或 SSH 檢查),組織可以開始收集服務(wù)器連接、網(wǎng)絡(luò)延遲、網(wǎng)站響應(yīng)時(shí)間等指標(biāo)。這些指標(biāo)讓組織可以大致了解他們的網(wǎng)絡(luò)是如何共同執(zhí)行的,以及不同位置的一般用戶體驗(yàn)是什么樣的。
通過更高級(jí)的設(shè)置(例如運(yùn)行無頭鉻),組織可以開始測(cè)試網(wǎng)站或 Web 服務(wù)的整個(gè)事務(wù)流。遠(yuǎn)程代理還可用于監(jiān)控指定應(yīng)用程序訪問點(diǎn)的性能。此信息可用于確定某個(gè)應(yīng)用程序如何為來自不同地理位置的用戶提供服務(wù)。
收集單個(gè)用戶級(jí)別的指標(biāo)通常需要應(yīng)用程序?qū)⒈O(jiān)控模塊捆綁到其應(yīng)用程序包中。從個(gè)人用戶那里收集的數(shù)據(jù)將為組織提供有關(guān)用戶如何使用應(yīng)用程序的最詳細(xì)信息,甚至能夠重建用戶的行為以進(jìn)行進(jìn)一步分析。
使用預(yù)測(cè)分析的數(shù)字體驗(yàn)管理
通過從綜合監(jiān)測(cè)收集的數(shù)據(jù),可以應(yīng)用許多分析。這些分析范圍從基于拓?fù)涞男阅芊治龅接脩魠⑴c模擬。合成監(jiān)控?cái)?shù)據(jù)都具有基本的地理信息,并且該地理數(shù)據(jù)可用于生成網(wǎng)絡(luò)延遲熱圖,如下例所示,以指示可能具有比平時(shí)更高延遲的潛在區(qū)域。
用戶參與模擬是模擬用戶使用服務(wù)的旅程,并指出可能影響用戶體驗(yàn)的潛在風(fēng)險(xiǎn)。例如,組織可以將計(jì)劃的 ping 檢查添加到其 Microsoft 365 訂閱。根據(jù)收集的數(shù)據(jù),組織可以確定在一天中的特定時(shí)間是否存在很可能具有高網(wǎng)絡(luò)延遲的位置。相應(yīng)地,公司可以按位置調(diào)整訂閱,或者分配更多的網(wǎng)絡(luò)資源來支持高流量的位置。這一切都可以主動(dòng)完成,而不會(huì)犧牲任何員工的時(shí)間或精力。
結(jié)合其他網(wǎng)絡(luò)監(jiān)控?cái)?shù)據(jù),可以應(yīng)用更多基于 ML 或 AL 的分析來深入了解組織的數(shù)字健康狀況。在以下示例中,我們概述了電子商務(wù)公司如何利用綜合監(jiān)控技術(shù)來改善其產(chǎn)品體驗(yàn)。該公司打算從其大多數(shù)用戶集中的幾個(gè)地點(diǎn)監(jiān)控其整個(gè)交易體驗(yàn)。
第 1 步:公司可以從這些位置部署代理,并使用無頭 Chromium 執(zhí)行預(yù)定義交易的腳本,從搜索、瀏覽、添加到購(gòu)物車到支付執(zhí)行。
步驟 2:基于模擬,可以在某個(gè)頻率下收集每個(gè)階段的延遲。
步驟 3:通過應(yīng)用異常檢測(cè)和趨勢(shì)分析,可以將網(wǎng)頁(yè)掉線率、購(gòu)物車放棄率或支付失敗率等運(yùn)營(yíng)指標(biāo)映射到模擬數(shù)據(jù)并進(jìn)行預(yù)測(cè)。如果任何指標(biāo)超出健康范圍,則會(huì)發(fā)出警告,并應(yīng)進(jìn)行未來的調(diào)查或人為干預(yù)。
雖然這是一個(gè)非常簡(jiǎn)單的示例,但它展示了綜合監(jiān)控如何幫助改善組織的數(shù)字體驗(yàn)。此外,當(dāng)與其他技術(shù)結(jié)合時(shí),它舉例說明了它如何支持組織建立預(yù)警機(jī)制以防止?jié)撛诘钠茐摹?/p>