隨著企業數字化轉型升級進程的加快,企業IT系統架構越來越復雜,軟件更新迭代越來越快。企業信息化建設中的大量業務和數據需要依靠信息系統來完成,這使得構建穩定可用的IT系統成為企業業務發展的基礎條件,而IT運維管理也隨之成為企業信息化建設的重要環節。
近年來,因為IT系統突然出現故障導致業務癱瘓甚至造成巨額損失的現象頻出不窮。而大型數據中心由于對系統、數據的高度依賴,IT風險更大,企業對IT運維管理的重視也就更高。
從目前來看,很多大型企業的信息化建設已經具備良好的IT基礎,但由于沒有統一的管理平臺,企業內部無法掌握企業所有軟硬件系統的數量、版本、運行狀況 ,急需建立全面的IT運維管理體系。
本期華云大咖說,特別邀請華云數據架構師周宇帶來“企業級IT運維管理體系建設經驗分享”,結合華云數據自身數據中心運維經驗和正向混合云的運維管理經驗,幫助企業實現更精準的IT運維管理。
精彩觀點
1. 隨著信息技術的不斷深入,企業IT系統日漸復雜,IT系統的運營、維護和管理的難度不斷加大。為了保障企業IT系統及網絡的可用性、安全性、穩定性,保障業務的連續性,通過專業技術手段,對計算機網絡、應用系統、電信網絡、軟硬件環境及運維服務流程等進行的綜合管理。目前,企業運維管理體系建設常見問題包括超前建設、重復建設、滯后建設、無效建設。
2. 以重復建設為例,對于一般情況下來講,企業的IT建設由于各個業務部門所站的角度不同,關心的方向也不同,提出的需求只涉及本部門的業務,很少會站在企業的角度去思考和設計整體流程,以及與其它部門之間的配合。因此,如果企業沒有一份完整的IT建設規劃時,不僅導致重復建設的局面還可能導致各部門間的分歧。
3. 如果把企業運維管理體系建設建設比喻成房屋裝修,那么企業在運維管理建設前也應該有清晰的建設步驟。首先,要做到臺賬清晰,具體到環境、資產、系統、關系等方面的清晰。其次要做到故障可控,具體到環境、硬件、系統、業務等方面的可控。最后要做到故障預知預判,要進行歷史分析、事件關聯、趨勢預測、重點優化。
4. 企業運維管理體系是一項綜合性的系統工程,涉及到企業縱向的組織整合,橫向的業務整合,基礎數據的整合以及基礎設施的整合等多個層面。這就使得在運維管理體系功能模塊的建設中就要擁有與業務相關的模塊,包括企業級監控產品、應用監控工具、大數據應用等;與基礎平臺相關的模塊,包括風火水電管理工具、硬件監控管理工具、管理規章制度等。
5. 在企業運維管理中重中之重的便是變更管理。變更管理應該由不同人員擔任變更申請人/協調人,審批人及實施人的角色。如有特殊原因造成無法職責分離,需引入監管人員。避免造成不必要的損失。
6. 華云DCM數據中心管理平臺以數據中心硬件設備為核心,采用帶外管理方式對設備進行全生命周期管理,從采購到安裝使用,再到運維、報廢的整個過程服務,可以有效幫助客戶減少繁瑣、重復、費時的各項運維工作。帶外方式通過服務器的管理口實現,美國服務器租用,不需要在每臺服務器上安裝代理軟件,可以減少對操作系統的影響,并實現與操作系統的無關性,而且可以進行遠程的電源管理、虛擬KVM、虛擬媒體功能。
7. 華云DCM數據中心管理平臺可以從資源、機房、業務、設備等多種不同的視圖監控數據中心的各種資源。對于設備異常狀態可以實現多途徑的告警,包括郵件、短信、微信等形式。整個監控、分析都由華云DCM數據中心管理平臺后臺自動化執行,無需要人為干預去處理部分設備故障。同時,華云DCM數據中心管理平臺對機房空間、能耗進行自動化的數據收集、統計。
8. 華云DCM數據中心管理平臺支持通過帶外的方式對各個品牌各型號的小型機、刀箱&刀片服務器、機架服務、塔式服務器的硬件運行狀態進行實時的監測,彌補硬件管理空白。
9. 華云DCM數據中心管理平臺為IT資產提供了全生命周期的管理,提供了有效、準確、及時的IT資產信息。系統支持自動采集設備的硬件配置信息,有效的解決因人工錄入信息準確性得不到保證的問題。
10. 華云DCM數據中心管理平臺能夠實現對目前所有主流品牌的服務器、存儲、網絡設備等數據中心常見硬件的統一監控管理,美國站群服務器,客戶能在第一時間得到設備的運行狀態,為及時解決問題、保證生產系統的安全、平穩運行提供保障。并且通過華云DCM數據中心管理平臺,用戶可以提高數據中心的設備使用率,延長數據中心的使用壽命;降低運營成本;控制IT風險、為云計算實施提供最強大的基礎;簡化系統維護人員的日常操作的工作量,降低系統維護的復雜度;保障用戶業務運行加快從而推進企業IT發展。