7月2日,2019/35755.html">2019可信云大會在北京國際會議中心隆重開幕。2019/35755.html">2019可信云大會以“智能云網邊,可信創未來”為主題,由中國信息通信研究院主辦。
下午13:30大會特設的智能云論壇活動正式開始,2019/35742.html">百度智能云機器學習平臺資深產品經理陳媛做了《2019/35742.html">百度智能云機器學習平臺實踐分享》的精彩演講。
2019/35742.html">百度智能云機器學習平臺資深產品經理陳媛
各位專家、各位來賓,大家下午好!我是2019/35742.html">百度智能云機器學習平臺的產品經理,今天給大家帶來的是2019/35742.html">百度智能云機器學習平臺實踐分享。
從近年來趨勢上看,機器學習技術已經從高精尖實驗室研究技術走向產業,云服務功能也在不斷完善,尤其是基礎算力設施。企業可以借助云上的AI技術、算法、算力、能力和平臺不斷優化、不斷加強自身業務效果,最終將我們的機器學習技術從實驗室研究落地到實際應用中去。
2019/35742.html">百度智能云機器學習平臺愿景是幫助企業構建AI開發能力,希望成為最落地、最懂企業的機器學習平臺服務商。
2019/35742.html">百度智能云機器學習平臺面臨很多種用戶,如有大企業、中小企業、公民數據科學家、AI開發者,這些企業需求不一樣。針對不同企業和用戶的需求,我們也實現了很多種不一樣的產品形態,如對于中小企業、AI開發者、公民數據科學家,可以用公有云和私有云的形式來滿足他們的需求,對于大企業有軟件和硬件一起部署的需求,所以我們用一體機的產品形態來滿足大企業的需求。工業制造場景往往有預測的需求,物聯網有邊緣計算的需求。百度借助這些產品形態可以將百度的AI能力輸出到企業去,還可以將百度這種AI基礎設施能力、AI技術能力也輸出到企業中去,最終目的是降低企業AI使用門檻,提升企業AI生產效率,要賦能于金融、教育等各個行業。
2019/35742.html">百度智能云機器學習平臺布局。百度有非常雄厚的技術積累,有自研的PaddlePaddle技術框架,有高效預測服務框架,有自研的AutoDL等技術,為了將百度這些技術輸出給企業、用戶,我們平臺也分為兩層:底層是基礎AI開發平臺,上層是基于數據垂類和行業而定制化的定制化開發平臺。
基礎AI開發平臺,如進行數據處理,處理好的數據進行自動化建模,拖拽建模等等,最終產生的模型可以部署在線預測服務,然后供用戶使用。
數據垂類定制因為有數據源不一樣,所以把平臺分為語音、文本、圖片等不同的定制化平臺。
行業定制平臺是因為帶有行業自身的一些特有屬性,針對行業做一些行業的定制平臺。
百度輸出這些平臺也是為了將百度的技術更好地用行業、與數據、與場景相結合和使用。這些平臺的落地形式有很多種,有公有云形式,是基礎的AI開發平臺;有一體機的形式;有移動設備端上預測的形式;給用戶部署純軟件機器學習平臺的形式。
2019/35742.html">百度智能云機器學習平臺總體架構(如圖)
底層是資源層,有高性能的數據存儲系統、高效的集群管理和更合理的資源調度系統。
執行層,有深度學習和機器學習多種框架供用戶使用。
算子層,提供工程特征處理算子,如特征抽取、特征變換、標準化等等。
百度自研的機器學習算法。用戶輸入數據我們也可以做數據統計,輸出一些統計學數據展示給用戶。
建模應用層,建模方式有可視化建模、有交互建模,還有自動化建模,我們生產出的模型都可以流向模型倉庫進行版本管理,進行模型繼續的評估。已發布的模型可以到我們預測模塊去部署線上預測服務或離線跑批量預測。
交互層,用以可以通過在console上頁面點擊完成流程。
用戶權限管理模塊,監控告警模塊,自動化部署運維模塊,這些模塊整體構成了平臺總體架構。
2019/35742.html">百度智能云機器學習平臺的特點有四個方面:
1.快速上手。有點開即用的Jupyter環境,內置多種常用框架,有Demo可以學習。有Auto算法,可以省需用戶編程和超參數調優的繁重工作。
2.一站式開發&部署。用戶通過console點擊或API調用,可一站式完成發起訓練任務、獲取訓練模型、啟動預測服務,覆蓋AI開發&部署的全流程。
3.靈活。支持主流框架,支持自定義第三方軟件庫,支持用戶CCE集群。核心服務可靈活解耦,與您現有工作流程無縫對接。
4.高性能。多機多卡的分布式訓練和對企業級超大規模數據的支持,可顯著縮短開發所需時間。
點開即用IDE環境-Notebook。
集成Jupyter Lab框架;內置多種常用算法框架、軟件庫、demo;提供GPU資源;自動同步存儲中的數據,可以更方便用戶進行數據處理、編寫代碼。
訓練-深度學習作業。