例如,當Lady Gaga以僅99美分的售價在亞馬遜上架其專輯《Born This Way》后,瘋狂的粉絲們很快就使得亞馬遜龐大服務器資源被攻陷。同樣,當在線商城Target.com宣布進行一場龐大的銷售活動后,大量紛至沓來的網絡購物者的瘋狂涌入導致了其數據中心的崩潰。當然,還有最為著名的醫療保健網站HealthCare.gov發生崩潰的例子,云主機,一則廣告活動促使數百萬的美國用戶涌向該醫療保健網站的醫保項目,卻最終只能面對長時間的虛擬線路和無盡的錯誤信息。據估計,正是由于可用容量被大大超出,使得任何時候都有4萬多人被迫坐在虛擬候診室里等待。
上述這些例子都強調了在企業業務需求擴張之前,數據中心管理人員務必要確保對數據中心戰略保持提前規劃的重要性,同時還需要注意可能導致超出現有系統負載能力的突發高峰需求。而實現這一目標的途徑便是通過數據中心的容量規劃。
“當企業組織忽略了他們數據中心的操作運營環境中正在發生或者可能發生的事情時,便有可能出現性能問題和容量不足的情況,這可能會導致企業營收受損,免備案主機,生產力下降以及客戶體驗下降。” 容量管理供應商TeamQuest公司的前產品營銷經理John Miecielica表示說,他現在是Stratagem, Inc.公司的顧問。
“數據中心的管理人員們需要確保業務能力,服務能力,組件和資源能力均能夠以經濟高效的方式滿足企業當前和未來的業務需求。這與管理和優化基礎架構、應用程序和業務服務的性能息息相關。”
老話說:“如果沒有壞,就不用修理”。在許多不同的情況下,這可能是一個可行的原則。然而,就數據中心的容量策略而言,如上文中所給出的一系列例子所示,這可能是一大致命性的理念。
Miecielica介紹說,歐洲的一處數據中心在實施了容量規劃后,該數據中心從只能執行一些簡單的修復工作轉型為能夠基于精確容量預測實現恰當的規?;奶摂M環境。進而使得該企業組織避免了每月總共65000美元的基礎設施費用成本。此外,其所具備的找出瓶頸的功能還幫助該企業消除了數百臺性能表現不佳的虛擬機(VM)。
有用戶講述了一個類似的案例:Enterprise Rent-A-Car公司 、Alamo Car Rent A Car公司、National Car Rental和Enterprise CarShare的母公司Enterprise Holdings,Inc.(EHI)是全球范圍內最大的汽車租賃服務供應商。在過去,該公司數據中心的容量預測和建模是通過人工手動所收集的數據完成的,這些數據被輸入到微軟Office Excel表格和Office Access數據庫軟件中。這項工作屬于資源密集型且容易出錯,也往往是不準確的。而在當前這樣一個競爭激烈的市場上,這顯然是EHI公司所不能承受的。緩慢的系統可能意味著數百分輛的汽車租賃信息在幾分鐘之內就會丟失,以及在將車輛送到最需要的地方時出現延遲,從而導致客戶滿意度評分較低。
EHI公司的前IT系統架構師Clyde Sconce表示說:“我們曾經在數據收集、預測增長以及季度和年度的預測等方面耗費了大量資源和無數的時間。”
他所曾經供職過的這家公司在數據中心戰略方面犯了一個共同的錯誤——過于簡化需求。這方面的一個例子是通過考慮CPU當前的使用情況來創建預測,然后使用線性趨勢來預測所有未來的需求。
“如果你企業這樣做,你就會大錯特錯的。”Sconce說。
EHI公司部署實施了TeamQuest 公司的Surveyor以簡化預測,實現了流程自動化,并提高了準確性。這使得預測和報告能夠在必要時每周和每天更新。進而使得其數據中心能夠擺脫被動模式,隨時了解變化,并采取相應的措施以確保其系統從未遭受到Lady Gaga粉絲攻陷數據中心服務器般的事件。
容量預測輸入是從Surveyor獲得的,并結合從Java工具集合所收集的各種業務度量和數據。然后將其轉化為對CPU和業務增長的預測,每臺服務器美元成本的預測,與不同業務和管理人員相關的預測,甚至形成了檢查早期預測準確性的方法。
這里的重點不是試圖根據一個或兩個指標來預測未來。相反,EHI公司從各種數據來源提取了廣泛的參數,包括服務器配置(包括當前和歷史配置信息),資源消耗情況(CPU,內存,存儲)和業務交易(通過用戶代理)等數據庫信息。針對其UNIX AIX環境,諸如rPerf(相對性能)等指標幫助其數據中心了解是否需要添加或刪除CPU來提高性能。
Sconce提醒數據中心經理們在研究數據中心策略時務必需要注意可能導致預測錯誤的異常情況。以新服務器的歷史數據不完整或不存在的情況為例。這可能導致一種異常情況,比如一臺相當新的服務器被預測為或將有300%的需求增長。