對AI應用措施來說,機緣已經成熟。但在企業數據中心實施人工智能時會對網絡、存儲和計較基本設施造成障礙。
盡量人工智能的觀念自50年月以來一直存在,但它在IT規模的主流應用措施方才開始呈現。按照Gartner的研究,到2021年,深度進修和人工智能等事情量將成為數據中心設計和架構的重要因素。
AI應用措施將影響每一個垂直行業和家產規模,因此采納努力的法子來籌劃、構建和培養數據中心的深度進修(deep learning)和人工智能實踐很是重要。
大大都組織還沒有實施AI.在大大都環境下,超大局限民眾云提供商(如Google和Amazon Web Services)都是早期回收者,而絕大大都終端用戶都在起步階段就舉步維艱。
Gartner研究總監Chirag Dekate暗示:“由于這是個一連變革的方針,很難初始化開拓AI和深度進修情況的實踐。這個想法是驚人的,可是當您著手開拓和設計辦理方案時,您就開始碰著問題了,美國抗攻擊服務器 亞洲服務器,并且這是許多最終用戶當前所處的位置。”
來自存儲的挑戰
深度進修和AI應用措施需要大量的數據來練習、測試和驗證神經網絡算法,這大概為數據中心打點員帶來存儲挑戰。
Dekate暗示:“假如您的呆板進修算法基于回歸,您可以利用有限的數據集,可是對付更先進的高代價神經網絡生態系統,您會逐漸碰著局限問題。傳統的網絡毗連存儲架構可以交付即時的功效,利便陳設和開箱即用的效率,但它們也會在I/O擴展和延遲方面顯示出問題。
部門初創公司正在實驗高帶寬并行文件系統,以增加吞吐量并實現局限化,但這些還都只能算是外圍要領,Dekate暗示。
并行文件系統涉及從元數據處事器到存儲方針的很多移動部件,必需舉辦優化、調解和調試以最高效率運行。他說:“它們[并行文件系統]長短常巨大的,需要經驗嚴苛的檢驗。”
然而,大數據闡明——另一項需要大量數據的打算——已經為很多IT組織提供了一個平臺,可以或許從頭調解存儲計策。
供職于451 Research的研究司理Christian Perry暗示:“當AI成為企業可陳設的現及時,從存儲的角度來看,由于大數據和闡明的原因,容量方面已包辦理了。物聯網也被寄予期望在特定組織驅動大局限應用的籌劃,我認為基本設施已經具有處理懲罰大型存儲需求的本領。”
來自網絡的挑戰
深度進修框架的有限性發生了局限方面的挑戰——對付可擴展性的網絡架構,機能明明超出單一計較節點。為了局限化以提供更高的效率,打點員必需進級和改造他們的網絡,但大大都人還沒有將此舉當做他們的首要任務。
Dekate說:“假如您仔細調查深度進修算法,會發明它們的相同麋集度很是之高。實驗為這樣一個談天應用措施倉庫構建辦理方案對付組織如何著手開始將長短常堅苦的。”
跟著數據中心網絡架構師為AI籌備其基本架構,他們必需優先思量可擴展性,這將需要高帶寬、低延遲的網絡和像InfiniBand或Omni-Path這樣的創新型架構。
要害是為實現自動化而擔保所有選項的開放性,Perry說。自動數據中心基本設施打點技能的市場正在快速成熟,這表白自動化在數據中心行業越來越被遍及地接管。
Perry說:“尚有自動化成果已經具備應用條件,這將有助于為AI的引入奠基基本。”
來自計較方面的挑戰
數據中心的計較端對AI應用措施的實施面對著異常嚴峻的挑戰。基于CPU的情況可以處理懲罰絕大大都呆板進修和AI事情負載,從隨機叢林回歸(random forest regression)到集群。但當IT深入到深度進修本領之中,這需要遍歷多個大型數據集并陳設可擴展的神經網絡算法,那么基于CPU的生態系統大概還不足。為了提供計較本領,IT部分必需集成如NVDIA GPU、Advanced Micro Devices GPU和Intel Xeon Phi等技能。
“您需要殽雜或異構架構,其焦點處理懲罰器由專用加快器填充,為您的應用措施提供更大的計較密度和更高的吞吐量,”Dekate說。
實施GPU還使打點員可以或許優化數據中心基本架構以實現功率效率。當打點員將基于GPU的生態系統舉辦單一節點出格擴大時,它們對電源的需求將越發急切。
Google等超大局限供給商已認識到這一需求;該公司認真AI業務的機構DeepMind將將其數據中心冷卻所需的能源低落了40%.可是,在更遍及的市場中險些所有的企業數據中心都缺乏Google具備的資源,將無法復制這一模式來辦理效率問題。
對付具有傳統生態系統的大大都企業來說,實施這些創新技能不只巨大—同時價值昂貴。譬喻,搭載了最新Xeon Phi的芯片價值高達6,294美元—它是英特爾迄今為止最昂貴的芯片。而想要整合深度進修本領的IT團隊不只僅需要一個芯片,他們需要高密度的加快卡。這些高密度計較設置可用于超大局限情況,醫療保健機構、金融處事等。