眾所周知,大多數 IT 服務要么托管在云中,要么朝著那個方向發展。事實上,當今企業基礎設施環境中基于云的服務的激增將被視為 IT 市場所見證的最引人注目和最重要的趨勢之一。雖然在可擴展性、敏捷性和彈性方面獲得的巨大優勢不容忽視,但云計算可以(并且通常確實)引入了一些可見性和控制挑戰。無論采用何種風格(IaaS、PaaS、SaaS、STaaS)或架構(公共、私有、混合、過渡),基礎設施和運營 (I&O) 領導者都發現大多數云提供商不提供(甚至允許)足夠的可見性。
展望未來,I&O 領導者將如何像過去那樣承諾、衡量和實現給定的用戶體驗 SLA?他們將如何準確評估利用率水平以確定產能的超額認購或認購不足?他們將如何發現潛在的問題和瓶頸,而不是在他們有機會惡化并最終影響生產流量之后?
處理大多數基礎設施即服務 (IaaS) 產品的不透明性
通常,IaaS 供應商傾向于將活動隱藏在“幕后”,并假設您會對 Web 工作負載的模糊匯總匯總數據感到滿意。您可能必須自己處理事情。因此,請考慮允許通過 REST-API、Webhook 或其他集成方式直接訪問您的核心云提供商的工具。但是,如果不滿足某些要求,即使是最好的工具也無法勝任。首先,您驗證您現有的管理和云供應商是否支持這些數據收集方法。接下來,開始對示例事務和工作負載進行持久輪詢。最后,把它們綁在一起。您需要對這些在實際生產流量中出現的輪詢樣本進行建模,并結合每個步驟、調用和掛鉤以提供完整的圖片。
過濾掉噪音
太多的數據比沒有足夠的數據更糟糕。當收到大量入站通知時,I&O 人員將進入“警報疲勞”模式。他們將開始考慮重要問題以及誤報和冗余警報。因此,保持很高的信噪比警報比并避免這種綜合癥至關重要。重要的是要注意,許多孤立的事件在它們自己發生時是良性的,但當它們與其他特定事件一起發生時,它們可能會帶來麻煩。您不想讓這些孤立和無關緊要的事件淹沒您的團隊,因此開始考慮哪些需要作為一個集體進行監控。繪制所有應用程序依賴關系,并通過條件、順序或其他模式觸發語句策略性地將相關事件聯系在一起。
可見性:所有元素的單一屏幕
將您能夠實現的基于云的資源的可見性保持在前端和中心,與其他 I&O 指標一起堆疊。如果人員必須篩選各種屏幕以獲取特定于云的內容,那么這些指標將不會得到所需的關注。當今的云環境可能很難控制,但實施正確的可見性策略可以讓您走上正確的道路。