如今,監(jiān)控非常重要。這是為什么?因為應用程序變得越來越復雜。但不僅是應用程序——基礎設施也變得復雜。一些公司正在遷移到云端;其他人正在構(gòu)建混合基礎設施。如果某些基礎設施在云中,而其他基礎設施在本地,那么如何獲得整個基礎設施的概覽就會更加模糊。在這篇文章中,您將學習如何很好地監(jiān)控混合云基礎架構(gòu)。
什么是混合云監(jiān)控?
首先,讓我們澄清一下混合云監(jiān)控與傳統(tǒng)監(jiān)控的不同之處。最大的不同是我們有兩個非常不同的基礎設施需要監(jiān)控。用于本地監(jiān)控的傳統(tǒng)工具在云環(huán)境中表現(xiàn)不佳,反之亦然。因此,要么您需要做出妥協(xié)并使用兩種不同的監(jiān)控解決方案,要么您需要找到一種同時適用于本地和云基礎設施的解決方案。因此,讓我們討論一下您通常如何監(jiān)控這兩者,然后我們將了解如何創(chuàng)建良好的混合云監(jiān)控。
監(jiān)控本地基礎設施
當您必須處理裸機服務器和您自己的網(wǎng)絡設備時,您將專注于與在云中不同的事情。您必須查看所有低級指標,例如 CPU 溫度、硬盤運行狀況、負載平衡器飽和度等。即使您在裸機之上有一些抽象層(例如,虛擬化或容器編排) ),您仍然需要監(jiān)控底層機器。您甚至可能需要監(jiān)控冷卻風扇速度和UPS狀態(tài)等內(nèi)容。
您的本地監(jiān)控目標也將與您在云中進行的監(jiān)控略有不同。擴展和容量規(guī)劃在本地是不同的。因此,在監(jiān)控本地機器的使用情況時,您會更經(jīng)常地查看長期使用模式。由于擴展數(shù)據(jù)中心通常需要數(shù)周時間,因此您必須更早地預測增加容量的需求。
您通常用于本地監(jiān)控的實際工具也不同于您用于監(jiān)控云的工具。傳統(tǒng)上,這些工具要求您在基礎架構(gòu)中的某處安裝和管理監(jiān)控服務器。這意味著您還需要關心諸如容量監(jiān)控和工具本身升級之類的事情。
云監(jiān)控
即使監(jiān)控的總體思路保持不變,但如果您的應用程序在云中運行,您的監(jiān)控重點將有所不同。對于初學者來說,您不會關心(甚至無法訪問)溫度和風扇速度之類的東西。通常,與本地不同,您只會監(jiān)控機器上的一兩層。例如,如果您的應用程序在虛擬機中運行,那么在云中,您只需擔心該虛擬機的 CPU 和內(nèi)存使用情況。但是,在本地,您不僅要監(jiān)控該虛擬機,還要監(jiān)控底層的裸機服務器。
另一件事是云為您提供了很大的靈活性和快速擴展。這意味著您的監(jiān)控需要對資源消耗的峰值做出快速反應,以便有效地使用自動縮放功能。說到自動縮放,在云中您肯定要監(jiān)控的是成本。與您的成本是靜態(tài)的本地部署不同,在云中,您(通常)按使用付費。因此,您不僅要監(jiān)控整體增長的成本,還需要找到過度使用(甚至未使用)的資源,以便縮減(或關閉)資源以節(jié)省成本。
談到工具,那些旨在監(jiān)控云的工具通常以軟件即服務 (SaaS) 的形式出現(xiàn)。您無需安裝和管理實際的監(jiān)控工具。您只需要將所有指標發(fā)送給它。
如何監(jiān)控混合云基礎設施
正如我們之前提到的,您有兩個選擇。一種解決方案是使用兩種不同的工具(一種更適合本地,一種更適合云)。令人驚訝的是,這是一種非常常見的方法,但出于錯誤的原因。公司不會從頭開始構(gòu)建混合基礎架構(gòu)。當他們想要將本地部署緩慢遷移到云時,他們最終會使用混合基礎架構(gòu)。這意味著,通常,他們已經(jīng)設計了一個本地監(jiān)控系統(tǒng),并且已經(jīng)運行了很多年。這就是為什么當他們在云中邁出第一步時,他們通常會為云創(chuàng)建一個新的監(jiān)控系統(tǒng)。這是因為通常會組建一個全新的團隊來管理云環(huán)境。但是分別監(jiān)控這兩種環(huán)境會帶來很多缺點。
在混合云中,系統(tǒng)的一部分在本地運行,一部分在云中。但歸根結(jié)底,它是同一個系統(tǒng)。他們一起工作。因此,用一種工具監(jiān)控其中的一部分,用另一種工具監(jiān)控部分會使您處于“錯過大局”的危險境地。一些公司意識到了這一點,那么他們會怎么做呢?他們將本地監(jiān)控擴展到監(jiān)控云的某些部分,并嘗試使用云監(jiān)控工具來監(jiān)控部分本地。這部分解決了對整個系統(tǒng)進行概覽的問題,但產(chǎn)生了一個新問題。現(xiàn)在您監(jiān)視相同的系統(tǒng)兩次。那效率不高。
統(tǒng)一監(jiān)控
那么解決方案是什么?統(tǒng)一監(jiān)控!不要將混合云視為兩個獨立的環(huán)境。將它們視為同一系統(tǒng)的兩個部分,因為事實上它們是。使用可以很好地監(jiān)控本地和云系統(tǒng)的工具。
即使您有單獨的團隊管理雙方,您仍然可以從統(tǒng)一監(jiān)控中受益。您的本地團隊將從監(jiān)控工具本身的管理任務中解脫出來。同時,您的云團隊將對基礎架構(gòu)的本地部分有很好的了解。在混合環(huán)境中,客戶的請求通常需要訪問本地和云中的一些系統(tǒng)才能完成請求并發(fā)送響應。
在這兩個系統(tǒng)中沒有可見性的情況下,云團隊只能猜測“如果這些錯誤不是來自我們,那么它一定是本地端出了問題。” 同樣的猜測也會發(fā)生在本地端。這會導致調(diào)試過程很長,這也意味著如果發(fā)生真正的災難,您的恢復時間會更長。統(tǒng)一監(jiān)控,無需猜測。
將來自所有來源的所有數(shù)據(jù)組合到一個監(jiān)控系統(tǒng)中帶來了另一個優(yōu)勢:能夠關聯(lián)來自不同來源的數(shù)據(jù)。云中 CPU 使用率的增加并不一定意味著云中發(fā)生了某些事情。這可能意味著本地系統(tǒng)對云請求的響應速度較慢;因此,云系統(tǒng)需要付出額外的努力來滿足需求(更多的 CPU 用于緩存或更多的 CPU I/O 等待時間)。統(tǒng)一監(jiān)控可幫助您輕松發(fā)現(xiàn)此類情況。
概括
監(jiān)控混合云的總體思路很簡單。您需要了解本地和云環(huán)境發(fā)生了什么。在實踐中,這通常是通過擁有兩個獨立的監(jiān)控解決方案來實現(xiàn)的。雖然這并非完全錯誤,但在這篇文章中,我們試圖向您展示不同方法的好處。
使用一種監(jiān)控工具監(jiān)控您的混合云會更好。它不僅有助于減少本地和云團隊的調(diào)試時間,還允許您關聯(lián)來自系統(tǒng)不同部分的數(shù)據(jù)。最重要的是,如果您將應用程序監(jiān)控添加到同一解決方案中,您會發(fā)現(xiàn)自己對系統(tǒng)的任何部分都有很好的可見性。