11月4-6日,OpenInfra開源基礎設施峰會在上海舉行,峰會首日,浪潮聯合英特爾發布了《基于500節點大規模單一集群行業云部署和性能優化白皮書》(以下簡稱《白皮書》),為社區成員與用戶構建更大規模的OpenStack單一集群,提供了詳盡指導規范。
作為今年OpenStack領域最具影響力的事件之一,雙方基于浪潮云海InCloud OpenStack 5.6(Rocky)完成的單一集群500節點大規模測試受到社區關注。在大會keynote環節,OpenStack基金會個人獨立董事王慶介紹了大規模測試概況,評價本次測試為OpenStack發展歷程中重要的里程碑事件,將為OpenStack在大規模乃至超大規模的云建設場景落地提供參考。
OpenStack基金會個人獨立董事王慶在keynote上介紹大規模測試概況
大規模、開放、敏捷成為行業云新特征
目前,電信、交通、能源、金融等行業的云計算規模正不斷提升,對大規模和超大規模行業云部署的需求更加迫切,諸如金融產品上線、城市軌道交通系統等具備強周期性的業務系統,對云平臺的高性能、高可用特別是高并發有著更高的要求。在這些業務場景的驅動下,行業用戶對單一集群規模提出了更高的需求,希望通過部署更多的虛擬機、容器等資源以支撐更多工作負載,進一步提升 IT 資源利用率并降低運維管理復雜度。以移動云為例,directadmin漢化,作為中國移動政企市場產品和服務統一入口,三年內規模超過20w節點,并且需要與5G網絡相融合,云平臺在大規模基礎上,滿足云網合一、隨需定制、安全穩定等要求。
《白皮書》指出,單一集群規模提升帶來的好處顯而易見,能夠實現更高、更靈活的工作負載,提升云平臺的伸縮性并顯著降低管理復雜度。不過,目前基于開源技術構建大規模行業云仍面臨諸多挑戰。
首先,開源應用的快速增長帶來了工作負載的提升,而日益豐富的開源技術堆棧則進一步擴大了云平臺性能的上下限差距,優化效果的好壞直接關乎性能表現。
其次,敏捷基礎設施成為重要趨勢,大規模的行業云將千倍放大單節點的成本支出,因此,對于性能進行持續優化、并增強成本的控制能力至關重要,需要在軟件定義層面實現性能、QoS、TCO的輕松調配。
最后,在開源技術日益活躍的全球性趨勢下,基礎設施的開放性至關重要。調研顯示,在中國,已經應用了開源技術的企業占比達到86.7%,有計劃應用開源技術的企業占比10.6%,VPS租用,開源技術已經被企業普遍接受,將更多的開源技術融合到統一的云平臺中變得更加重要。
浪潮云海 出色完成單一集群全球最大規模壓力測試
當前,基于社區原生版本的云平臺規模普遍較小,500個節點規模已經超出了負載的峰值,嘗試在 500個節點上成功部署 OpenStack 必須進行大量復雜的測試和優化。今年9月,浪潮云海ICOS 5.6成功完成單一集群規模達500節點的測試,這是目前基于OpenStack Rocky版本進行的單一集群全球最大規模實踐。
測試結果顯示,在高密度、高并發環境測試中,在系統已有20,000虛擬機負載的情況下,成功完成負載60%環境下的1,000 并發虛擬機創建,空載環境下2,000并發虛擬機創建。同時,測試驗證了大規模集群在全部節點數據庫災難恢復、全部控制節點斷電等極端情況下的高可用性,最大程度減少業務中斷。
在高性能方面,浪潮從硬件層、操作系統層、網絡協議棧、Hypervisor層、OpenStack API服務、數據庫以及消息隊列、分布式存儲、GuestOS等進行了全棧優化,系統性能可以滿足大規模行業云應用對于負載的需求。
此外,浪潮云海ICOS 5.6也實現了高效的云平臺軟環境部署交付,10小時完成500臺服務器節點系統部署、5小時部署323個OpenStack節點、3小時部署77個分布式存儲節點、1小時完成100個計算節點擴容改配,單日可交付500+節點。
目前,浪潮云海ICOS已具備單集群設計規格超1000節點能力,并在廣電等客戶中成功部署了單集群1000+節點的大型行業云。
此外,在本次峰會上浪潮云海InCloud OpenStack團隊與百度智能云、無錫地鐵信息管理部門共同入圍超級用戶評選。