有效的監控意味著 IT 人員能夠快速準確地獲得有關不當行為和異常的信息,以便他們可以在用戶開始不斷增加的級聯報告和投訴之前進行診斷和響應。事實上,如果沒有有效的監控,IT 就處于“反應模式”——也就是說,它不會開始處理問題,直到用戶打電話報告(或抱怨)問題。在這種操作模式下,IT 花費了太多時間來嘗試解決問題來做其他事情,例如規劃增長、評估新技術、部署新解決方案,以及所有其他允許信息技術幫助公司和組織更好的事情。富有成效的。
想想所涉及的動態。如果服務臺或支持團隊等到用戶開始抱怨才開始采取行動,這很可能意味著問題或問題在報告開始出現之前已經存在了一段時間。此外,用戶認為的問題通常是癥狀,而不是而不是根本原因或基本問題的有意義的指標。當用戶通過電子郵件將報告發送到辦公桌時,他或她可能已經嘗試讓自己重復工作,然后去找他們的同事和同事尋求幫助和討論。感知到的問題可能需要 45 分鐘或更長時間才能成為報告的問題,這會導致故障單并啟動響應機制。
唉,當 IT 在被動模式下工作時,這也意味著 IT 正在同時建立技術債務。這是因為花費在滅火上的時間是從調查新技術、規劃升級和更換以及部署更高效、更有價值的解決方案和安全性方面花費的時間。這使 IT 處于落后的位置,迫使他們花費時間和精力來滅火,在跟上技術的無情發展方面幾乎沒有或根本沒有前進。
有什么選擇?一種更主動的 IT 管理方法,基于有效監控允許先發制人響應的理解。如果公司網站的典型響應時間從頁面下載的 1 秒躍升至 5 秒,那么監控可以在發生這種情況時立即向 IT 員工發出警報。他們可以開始調查并開始進行診斷和修復或解決方法,甚至可能在用戶開始注意到事情正在放緩之前。對于 Internet 帶寬和磁盤空間等資源也是如此:通過在容量接近耗盡或完全消耗時設置閾值警報,而不是等待瓶頸出現,IT 可以開始安排添加資源,或防止其在用戶開始注意到系統已用完之前,不需要的或低優先級的消耗。
IT 管理的一種主動方法是實施應用程序性能管理工具。APM 工具(如Stackify Retrace)使開發團隊能夠在最終用戶受到影響之前發現其代碼中的性能問題。當某些事情超出指定的閾值設置時,Retrace 的自動警報會通知用戶,從而允許主動排除故障。例如,開箱即用的 API 網關限制每秒 10,000 個請求。當您的請求達到 70% 到 80% 時,在 Retrace 中設置警報可讓您主動優化應用程序以應對增加的請求。
當 IT 監控有效且高效時,它可以將其最寶貴的人員和資源用作“防火”(字面意思是在發生中斷或服務中斷之前避免它們)、調查新工具和技術、規劃升級和部署等上。通過有效的監控,即使發生最壞的情況并且某些東西確實發生了故障或故障,它也有助于縮短從該事件到實現修復之間的時間,因為它提供了有關原因和影響的詳細、集中的信息——理想情況下,在用戶投訴電話開始之前在。
盡管這似乎是對時間、精力或金錢的巨大且可能昂貴的投資,但如果您選擇了正確的供應商,則不一定非要如此 - 一個可以解決典型問題的供應商。建立有效的監控是保護組織的數字基礎設施的最重要的事情之一,并且會立即帶來好處,特別是在提高用戶滿意度和提高生產力方面。