當 IT 工作負載從本地IT 基礎架構轉移到異地云數據中心時,確保服務級別與您的業(yè)務需求一致非常重要。為云解決方案的每個元素定義服務級別的參數和指標應該滿足這些要求。服務提供商應保持高性能、安全性和合規(guī)性標準,同時仍提供吸引客戶的負擔得起的成本結構。
為了實現這些目標,組織必須根據明確定義的目標來理解、衡量和評估服務行為。服務水平協議 (SLA)的主題被廣泛討論,以討論云服務提供商的責任。但是,更好地理解服務水平目標 (SLO) 可以幫助評估對最終用戶真正重要的服務性能測量。那么,讓我們看看這些 SLO。
什么是服務水平目標?
服務水平目標 (SLO) 用作指標、參數或用特定服務水平目標定義的指標的基準。目標可以是構成云服務的每個服務功能或流程的最佳范圍或特定值。
SLO 也可以稱為 SLA 的可測量特征,例如服務提供商和客戶都可以實現、可測量、有意義和可接受的服務質量 (QoS) 方面。SLO 作為一項義務在 SLA 中被約定,在特定條件(例如時間段)下有效,并在 SLA 文檔中表達。
SLO 的工作原理
雖然定義有效 SLO 的最終目標是為最終用戶提供可靠的服務,但接近 100% 可靠性的成本和復雜性呈指數級增長。(看看這如何通過服務可用性得到回報。)
云服務的每個組件都會對客戶感知的服務性能產生不同的影響。例如,應用程序可能需要特定性能級別的響應能力,超出該級別客戶就無法再感受到差異。
響應能力和應用程序性能的衡量標準可以通過數字指標來定義,例如:
- 請求延遲
- 批量吞吐量
- 每秒失敗次數
- 其他指標
這些指標隨時描述服務水平。
要了解在商定的 SLA 合同或可用性要求的上下文中的整體性能,您必須在更長的時間段內分析這些數字。在數學上,SLO 分析涉及:
- 長時間聚合服務水平指標性能。
- 將結果與系統可用性的數字目標進行比較。
SLO 是一個范圍
SLO 并非旨在定義最佳性能級別。相反,它應該定義一系列可能的最佳和最不可接受的性能標準。想象一下這樣一個場景,其中以 99% 的正常運行時間的 SLA 購買云服務,轉換為每月 7.31 小時的停機時間。幾個月過去了,系統保持在 SLO 的上限,提供 99.9% 的正常運行時間,或者每月的停機時間少于一小時。
突然,當系統確實連續(xù)幾個小時停機時,最終用戶會對服務表現低于他們通常的預期感到不快。同時,如果服務提供商不打算或不承諾提供可能的最佳 SLO,它可能沒有義務提供支持。
由于 SLO 涉及對描述系統可靠性的幾個可量化指標的測量,因此您應該仔細理解術語 Reliability 和 Availability 之間的區(qū)別。在實踐中,SLO 由可接受的最低可靠性標準定義。
SLO 最佳實踐
簡而言之,服務水平目標描述了基于特定服務水平指標的測量在特定時間段內服務可靠性的好壞程度。
以下最佳實踐可以幫助您實現這些目標:
- 確定正確的指標和指標,以準確描述您的組織和最終用戶所感知、預期和要求的系統可靠性。
- 確保合適的人了解 SLO。技術團隊和組織領導應該很好地理解 SLO。組織應根據業(yè)務需求以及組織可用的技術能力和專業(yè)知識來設計 SLO。
- 使技術團隊和業(yè)務利益相關者在 SLO 目標上保持一致。如果工程師無法實現 SLO 目標,組織將面臨無法向客戶遵守其 SLA 的風險。
- 為系統的每個邏輯組件使用獨立的 SLO。每個系統組件可能對整個系統產生不同的影響或貢獻。因此,重要的是根據成本、復雜性和其他相關的業(yè)務和技術挑戰(zhàn)為每個系統組件定義最佳 SLO。
- 共同測量多個服務水平指標以評估單個 SLO 目標。例如,可能需要延遲、錯誤和其他 QoS 指標來評估關于特定目標的完整系統性能。
- 為所有利益相關者記錄和傳達 SLO。這些信息通常對技術團隊或業(yè)務領導者做出相關決策至關重要。
- 為某些客戶優(yōu)先考慮 SLO。與免費增值用戶相比,為具有嚴格可用性要求的付費客戶可能需要更高的 SLO 基線。
- 將SLO 視為一項持續(xù)的承諾,即在各種服務水平指標中提供最佳系統性能。SLO 會隨著時間的推移而發(fā)展;它們不能被視為靜態(tài)目標。IT 工作負載和最終用戶的期望不斷變化。為當前工作負載要求設計的 SLO 可能不適用于其未來的性能要求。
- 保持 SLO 簡單、少且現實。避免不切實際的絕對數字。您可以設置一個內部 SLO,作為安全邊際或緩沖區(qū),以提供最終用戶同意的較低 SLO 目標。
不需要完美
可能無法 100% 地滿足服務水平目標。云服務提供商需要創(chuàng)新、添加功能和更新系統,這可能涉及多個數據中心實例的臨時停機。
考慮這是實現 SLO 以提供更好服務的權衡
服務水平目標都是關于服務水平不被客戶和最終用戶接受的目標。設定切合實際的期望并且不過度實現目標可能是以可承受的預算提供具有可接受的最終用戶體驗的云服務的第一步。