10月18日-22日,第六屆世界互聯網大會在烏鎮舉行。本屆大會主題為“智能互聯 開放合作——攜手共建網絡空間命運共同體”,5G與人工智能成為大會的兩大焦點所在。大會期間,浪潮重磅發布人工智能資源平臺AIStation 2.0,將為客戶提供更加智能的AI容器化部署以及更具效率的分布式訓練。
浪潮在世界互聯網大會發布AI資源平臺AIStation 2.0
AIStation是浪潮面向人工智能企業訓練場景的人工智能開發資源平臺,可實現容器化部署、可視化開發、集中化管理等,為用戶提供極致高性能的AI計算資源,實現高效的計算力支撐、精準的資源管理和調度、敏捷的數據整合及加速、流程化的AI場景及業務整合,有效打通開發環境、計算資源與數據資源,提升開發效率。
浪潮人工智能開發資源平臺AIStation
AIStation 2.0將在目前1.0版本基礎上實現重大創新升級,全新支持當下最主流的Kubernetes容器引擎,可以更便捷地實現AI容器化部署并提供智能化任務調度,提高了集群資源利用率和深度學習訓練性能。具體而言,AIStation 2.0資源調度更親和,可智能化實現最優節點分配策略;創新的GPU多維細粒度分配策略能夠讓多人同時使用單張GPU,并且可充分利用閑暇時間訓練任務,最大化發揮計算資源的性能;訓練數據分層緩存預讀機制可大幅提高訓練速度。此外,AIStation 2.0還可支持IP粒度的單機和多機訓練任務調度,并實現batch類型的訓練作業的提交和穩定訓練。
更具效率的分布式訓練是AIStation 2.0的另一重要特性。當前,隨著數據的持續爆炸式增長以及AI模型復雜度的不斷提升,AI訓練集群規模也在隨之不斷擴大,人工智能領先公司開始部署超過千卡的大規模訓練集群,分布式訓練已經成為AI的重要發展趨勢之一。AIStation 2.0基于MPI-Operator進行了優化,使其支持TensorFlow、PyTorch、Caffe、MxNet框架的分布式部署,釋放分布式訓練潛在性能,多GPU訓練加速比可達到90%以上。同時AIStation 2.0實現了對單機和分布式訓練的容錯支持,系統能夠很好的應對算法類錯誤、OOM錯誤、系統故障等。
浪潮今年重磅發布了元腦生態計劃,在元腦生態中浪潮將與合作伙伴共享三大核心平臺能力,包括AI計算平臺、AI資源平臺和AI算法工具平臺。其中AIStation作為AI資源平臺具備重要的作用,構建開放的AI創新生態,無縫對接行業ISV,賦能生態伙伴,兼容各AI應用和場景。目前AIStation已經聚合了包含百度、第四范式、英特爾、英偉達、VMware等數十家家企業的AI框架、模型和工具組件,已應用到互聯網、通信、金融、交通、制造、醫療等場景中,成為生態豐富的人工智能資源平臺。
,美國站群服務器,歐洲服務器