基礎(chǔ)設(shè)施監(jiān)控是一種軟件工具的部署,用于自動(dòng)診斷整個(gè)技術(shù)堆棧中的性能和可用性問(wèn)題。
基礎(chǔ)設(shè)施監(jiān)控包括一系列的用途和問(wèn)題,從網(wǎng)絡(luò)優(yōu)化到診斷再到入侵檢測(cè)。基礎(chǔ)設(shè)施監(jiān)控可以告訴工作人員,路由器是否關(guān)閉,服務(wù)器是否以不尋常的利用率運(yùn)行,并且在適當(dāng)?shù)陌踩韵?,它還可以發(fā)現(xiàn)正在竊取企業(yè)數(shù)據(jù)的入侵者。
基礎(chǔ)設(shè)施監(jiān)控支持基礎(chǔ)設(shè)施管理,但兩者不同。基礎(chǔ)設(shè)施管理是企業(yè)根據(jù)監(jiān)控工具的發(fā)現(xiàn)采取的補(bǔ)救措施。基礎(chǔ)設(shè)施監(jiān)控可以不斷檢查IT平臺(tái)的各種元素,從內(nèi)部數(shù)據(jù)中心到私有云再到公共云。
隨著網(wǎng)絡(luò)越來(lái)越復(fù)雜,由于設(shè)備種類(lèi)越來(lái)越多,以及混合云的出現(xiàn),網(wǎng)絡(luò)完整性的重要性隨之增長(zhǎng)。即使在中小企業(yè)內(nèi)部的基本網(wǎng)絡(luò)上,也應(yīng)該對(duì)基礎(chǔ)設(shè)施進(jìn)行監(jiān)控,但是對(duì)于大型企業(yè)的復(fù)雜系統(tǒng),免備案主機(jī),它是運(yùn)營(yíng)的重要組成部分。
了解基礎(chǔ)設(shè)施監(jiān)控
在日常運(yùn)營(yíng)方面,基礎(chǔ)設(shè)施監(jiān)控是軟件工具的部署,用于自動(dòng)診斷整個(gè)技術(shù)堆棧中的性能和可用性問(wèn)題,以在問(wèn)題變得嚴(yán)重之前捕獲問(wèn)題。
“整個(gè)堆棧”是指硬件、操作系統(tǒng)、虛擬化環(huán)境、網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算和應(yīng)用程序。由于大多數(shù)大型基礎(chǔ)設(shè)施跨越多個(gè)位置,云服務(wù)器,同時(shí)包含公共云和私有云,這就給IT部門(mén)帶來(lái)了更大的挑戰(zhàn),因此,自動(dòng)化將成為關(guān)鍵。
由于具有復(fù)雜性,實(shí)現(xiàn)自動(dòng)化至關(guān)重要,原因如下:
自動(dòng)化可以比人類(lèi)更快地做出響應(yīng)。 它可以比等待人工干預(yù)更快地處理問(wèn)題。 假設(shè)企業(yè)已正確編程響應(yīng),自動(dòng)化可以減少錯(cuò)誤。 與人類(lèi)不同,它可以全天候運(yùn)行,不需要睡眠。
通過(guò)自動(dòng)化技術(shù),企業(yè)可以設(shè)置閾值,例如服務(wù)器利用率或網(wǎng)絡(luò)帶寬,以及當(dāng)網(wǎng)絡(luò)高于或低于設(shè)定閾值時(shí)的程序響應(yīng)。如果服務(wù)器凍結(jié)或停止,它也可以自動(dòng)重啟。
基礎(chǔ)設(shè)施監(jiān)控包括在出現(xiàn)問(wèn)題時(shí)添加和刪除要監(jiān)控的設(shè)備、性能、運(yùn)行狀況監(jiān)控、網(wǎng)絡(luò)和數(shù)據(jù)移動(dòng)監(jiān)控、報(bào)告/日志以及警報(bào)系統(tǒng)。這些通常是實(shí)時(shí)的,因?yàn)閷?duì)網(wǎng)絡(luò)瓶頸的警報(bào)在被發(fā)現(xiàn)6小時(shí)后是毫無(wú)意義的。
基礎(chǔ)設(shè)施監(jiān)控通常通過(guò)儀表板完成,儀表板通過(guò)視覺(jué)布局(如儀表)在一個(gè)位置顯示企業(yè)的所有信息。它們?cè)谄聊簧铣尸F(xiàn)實(shí)時(shí)更新,并可以在一段時(shí)間內(nèi)生成報(bào)告。
為什么需要基礎(chǔ)設(shè)施監(jiān)控
基礎(chǔ)設(shè)施監(jiān)控為管理者提供了實(shí)時(shí)了解基礎(chǔ)設(shè)施狀態(tài)所需的數(shù)據(jù),以及衡量組織目標(biāo)進(jìn)度的能力。通過(guò)不斷收集和審查有關(guān)基礎(chǔ)設(shè)施的數(shù)據(jù),監(jiān)控允許測(cè)量當(dāng)前狀態(tài)以及網(wǎng)絡(luò)的進(jìn)展情況。
例如,如果管理層已經(jīng)制定了實(shí)現(xiàn)一定級(jí)別網(wǎng)絡(luò)響應(yīng)的目標(biāo),那么監(jiān)控工具可以顯示網(wǎng)絡(luò)在響應(yīng)性方面的位置。它可以識(shí)別延遲的峰值,也許也可以找出原因。
確保網(wǎng)絡(luò)以最高效率運(yùn)行需要企業(yè)了解構(gòu)成IT基礎(chǔ)設(shè)施的設(shè)備,同時(shí)還要關(guān)注這些設(shè)備的健康狀況和性能。對(duì)企業(yè)的IT系統(tǒng)進(jìn)行主動(dòng)分析,意味著有更好的機(jī)會(huì)在導(dǎo)致嚴(yán)重中斷之前捕獲即將發(fā)生的故障。
有很多例子表明,如果沒(méi)有適當(dāng)?shù)?a href="http://www.qzkangyuan.com/cnidc/dc/jfjs/2018/27204.html">基礎(chǔ)設(shè)施管理會(huì)出現(xiàn)什么問(wèn)題。“僵尸服務(wù)器”就是這樣一個(gè)例子,物理服務(wù)器處于空閑狀態(tài),沒(méi)有人使用它。由Anthesis Group和斯坦福大學(xué)研究人員于2017年進(jìn)行的一項(xiàng)研究發(fā)現(xiàn),大型數(shù)據(jù)中心中多達(dá)30%的服務(wù)器是僵尸服務(wù)器,一直開(kāi)啟卻沒(méi)有做任何工作。這是適當(dāng)監(jiān)控的失敗,因?yàn)?a href="http://www.qzkangyuan.com/cnidc/dc/jfjs/2018/27204.html">基礎(chǔ)設(shè)施監(jiān)控器會(huì)記錄這些服務(wù)器沒(méi)有產(chǎn)生任何流量或根本不使用任何周期。
另一個(gè)例子是惡意軟件滲透。多年來(lái),有關(guān)于惡意軟件進(jìn)入企業(yè)網(wǎng)絡(luò)并使用企業(yè)網(wǎng)絡(luò)交付惡意有效負(fù)載、觸發(fā)垃圾郵件、發(fā)起分布式拒絕服務(wù)(DDOS)攻擊、嗅探網(wǎng)絡(luò)流量以獲取有用信息的故事和研究。同樣,這也是監(jiān)控有幫助的地方,因?yàn)樗鼤?huì)注意到一個(gè)未知的應(yīng)用程序發(fā)送數(shù)千封電子郵件或與俄羅斯的服務(wù)器通信。
基礎(chǔ)設(shè)施監(jiān)控優(yōu)秀實(shí)踐
以下是充分利用基礎(chǔ)設(shè)施監(jiān)控工具的幾個(gè)技巧:
確定優(yōu)先順序——提前確定哪些是最重要的通知按降序排列,這可能會(huì)花費(fèi)比處理電子郵件稍多一些的時(shí)間。
創(chuàng)建警報(bào)解決流程——應(yīng)為每種警報(bào)類(lèi)型提供最佳和最快的解決流程。同樣,這也是企業(yè)優(yōu)先考慮的問(wèn)題,因?yàn)樾枰ㄖ紫瘓?zhí)行官讓工作人員來(lái)處理。
購(gòu)買(mǎi)而不是建造——建設(shè)或購(gòu)買(mǎi)是一個(gè)歷史悠久的IT爭(zhēng)論。企業(yè)是自己建設(shè)還是鎖定供應(yīng)商?在這種情況下,由于IT系統(tǒng)日益復(fù)雜,企業(yè)最好購(gòu)買(mǎi)監(jiān)控工具。好消息是有很多可供選擇。