隨著互聯網的普及,現代人的生活已經從“衣食住行”邁向“衣食住行網”,人們對網絡的依賴程度正在逐漸加深。網絡作為現代人生活的標配,用戶在線時間和在線服務感受也在同步提升,而云化的IT架構變化在網絡出現故障時的客戶感知影響更為明顯。這也導致了用戶對網絡服務中斷的關注程度不斷提升。
然而,年初至今,運營商“斷網”事件屢上熱搜,“斷網”的原因有哪些?面對未來更加復雜的網絡,運營商又該如何布局?近日,通信世界全媒體記者采訪多位業內專家,談談“斷網”事件背后反映出的問題。
“斷網”非小事,原因不盡相同
在萬物互聯、移動支付的生活環境中,“斷網”事件對人們生活的影響不言而喻,而“斷網”的原因卻少有人會在意,只要盡快解決網絡服務故障,人們就會將“斷網”帶來的不快拋之腦后。但對于運營商而言,運營商提供最重要的服務就是網絡服務,香港服務器租用,因此網絡服務中斷應該被視為最重要的服務故障。
網絡服務是衡量運營商運營水平高低的標準。通信行業專家云晴表示,即便不考慮成本削減、人員流失等長期對網絡維護帶來影響的因素,運營商網絡的復雜性(不斷更新的新技術、IT化的趨勢),不斷變化的場景(網絡功能新增、業務新增),需要解決的新的安全隱患問題(IT化帶來的網絡安全問題,所面臨的各類網絡攻擊),城市化建設帶來基礎設施(例如光纜等)被破壞的可能性增加等,都給運營商提出了越來越高的維護要求。
多次“斷網”事件發生的具體原因不盡相同,據了解,除了天災人禍,云服務器,系統軟件缺陷引發網絡故障的概率相對較大,光纜故障、設備故障等概率較小。Strategy Analytics高級分析師楊光表示,這種情況只有系統廠商加強自身軟件工程能力,認真遵循軟件質量管理原則,才能降低軟件缺陷的風險。
同時,楊光指出,用戶數量過多肯定會增加網絡故障的風險,但只要遵循網絡容量管理的基本原則,運營商應該可以有效應對,這也正是近期三大運營商對4G網絡進行擴容的原因之一。但是,用戶數量多并不與網絡故障多發有必然聯系,否則我國運營商的故障率應該遠遠高于大多數國家。
擴容不是唯一辦法,網絡運維挑戰嚴峻
云晴認為,網絡質量雖然會受到系統處理能力的影響,但容量并非導致目前網絡服務中斷的主要原因。原因在于如果不是光纜中斷、核心數據錯誤,而且未實現容災的情況下,性能惡化導致網絡不可用的情況并不多見。更何況經過多年的發展,運營商系統的高可用保障已經達到了很高的程度。
而智能化運維被不少人看作是運營商的福音,但云晴指出智能化運維具有兩面性。盡管通過信息化手段實現對系統的智能化管理,確實能夠有效提高運維水平,但與此同時帶來的是對維護機制、管理流程、人員意識、相應的安全管控系統安全性等方面不斷提高的需求,這無疑增加了運營商的運維成本。
所以說,單純地通過擴大容量來提升系統的高可用性是片面的,網絡容量的提升,并不能夠確保網絡高可用問題的解決,智能化運維也并非目前解決“斷網”問題的最佳選擇。如何在網絡服務質量和運維成本之間達成平衡是運營商待解決的課題。
楊光表示,雖然斷網事件實屬偶發,但顯然運營商的災備工作仍需繼續加強,同時要加強對員工的培訓等,最重要的是維持多廠商供貨的格局,從源頭做好異廠商備份的工作。云晴表示,運營商需要在維護意識、管理機制、工作流程、系統手段等相關的系統工程中全面優化,從而提升網絡服務質量。