隨著成本的下降和用例的增加,高性能計(jì)算正在吸引各種類型和各種規(guī)模的新用戶。其擴(kuò)展選項(xiàng)包括基于超級(jí)計(jì)算機(jī)的高性能計(jì)算(HPC)系統(tǒng)、基于集群的高性能計(jì)算(HPC)以及基于云計(jì)算的高性能計(jì)算(HPC)服務(wù)。
在當(dāng)今數(shù)據(jù)驅(qū)動(dòng)的世界中,高性能計(jì)算(HPC)成為組織的首選平臺(tái),很多組織希望深入了解基因組學(xué)、計(jì)算化學(xué)、財(cái)務(wù)風(fēng)險(xiǎn)建模、地震成像等領(lǐng)域。最初由需要執(zhí)行復(fù)雜數(shù)學(xué)計(jì)算的研究科學(xué)家所采用,高性能計(jì)算(HPC)現(xiàn)在引起了各個(gè)領(lǐng)域組織和企業(yè)的關(guān)注。
高性能計(jì)算(HPC)數(shù)據(jù)存儲(chǔ)系統(tǒng)Panasas公司系統(tǒng)工程總監(jiān)Dale Brantly說,“我們依靠數(shù)據(jù)的收集、分析、分發(fā)而蓬勃發(fā)展的環(huán)境,并依靠可靠的高性能計(jì)算(HPC)來支持具有強(qiáng)大計(jì)算能力的簡(jiǎn)化工作流程。”
雖然中小型企業(yè)采用高性能計(jì)算(HPC)技術(shù)仍然相對(duì)較少,但對(duì)于愿意投資于這種技術(shù)和專業(yè)知識(shí)的組織來說,高性能計(jì)算(HPC)具有巨大的潛力。
通常,高性能計(jì)算(HPC)用例專注于某種類型的仿真。谷歌云首席技術(shù)官辦公室高性能計(jì)算(HPC)和量子計(jì)算技術(shù)總監(jiān)Kevin Kissell說:“高性能計(jì)算(HPC)可以模擬機(jī)翼上的氣流、發(fā)動(dòng)機(jī)燃燒、行星氣象系統(tǒng)、核反應(yīng),以及投資組合的估值。”其他用例則以分析為目的,例如統(tǒng)計(jì)廣告投資回報(bào)率或評(píng)估業(yè)務(wù)部門的績(jī)效。仍然可以將其他用例歸類為翻譯或轉(zhuǎn)換。他說:“就像視頻的渲染一樣。”
無需超級(jí)計(jì)算機(jī)的高性能計(jì)算
許多企業(yè)和IT領(lǐng)導(dǎo)者都誤以為高性能計(jì)算(HPC)系統(tǒng)都是基于超級(jí)計(jì)算機(jī)的。實(shí)際上,雖然由Atos、IBM、HPE、Cray和Fujitsu等公司生產(chǎn)的超級(jí)計(jì)算機(jī)是眾多專用高性能計(jì)算(HPC)系統(tǒng)的核心,但一種更廣泛使用的方法是將多臺(tái)小型計(jì)算機(jī)集成到互連的集群中以提供高性能計(jì)算(HPC)功能。在這種安排下,集群中的每臺(tái)計(jì)算機(jī)都充當(dāng)節(jié)點(diǎn)。每個(gè)節(jié)點(diǎn)通常配備有多個(gè)處理器(稱之為計(jì)算核心)用于處理計(jì)算任務(wù)。每個(gè)節(jié)點(diǎn)內(nèi)的處理器、圖形處理單元(GPU)和內(nèi)存資源相互連接以創(chuàng)建高性能計(jì)算(HPC)系統(tǒng)。
由于采購(gòu)和運(yùn)行超級(jí)計(jì)算機(jī)及其定制軟件的成本高達(dá)數(shù)百萬美元,其成本遠(yuǎn)遠(yuǎn)超出了大多數(shù)企業(yè)的財(cái)務(wù)承受能力。使用運(yùn)行現(xiàn)成軟件的相對(duì)便宜的互連計(jì)算機(jī),集群型高性能計(jì)算(HPC)通常更易于部署和運(yùn)行。盡管如此,對(duì)于大多數(shù)企業(yè)來說,即使是規(guī)模適中的基于集群的高性能計(jì)算(HPC)都是一筆巨大的投資,尤其是那些高性能計(jì)算(HPC)需求有限的企業(yè)。
現(xiàn)在這種情況正在改變。希望在不破壞IT預(yù)算的情況下獲得高性能計(jì)算(HPC)訪問權(quán)限的企業(yè)現(xiàn)在可以選擇使用公共云服務(wù),例如谷歌云、Microsoft Azure、AWS和IBM Cloud。
數(shù)字服務(wù)和軟件工程商Ciklum公司的.NET技術(shù)負(fù)責(zé)人Maksym Pavlov說,“這些服務(wù)使企業(yè)能夠訪問高性能計(jì)算(HPC)功能來滿足其業(yè)務(wù)需求,而無需大量投資高性能計(jì)算(HPC)集群的硬件基礎(chǔ)設(shè)施。”IBM公司云計(jì)算的副總裁David Turek補(bǔ)充,“云計(jì)算的出現(xiàn)在一定程度上平衡了小公司和大公司之間的競(jìng)爭(zhēng)環(huán)境。”
從高性能計(jì)算(HPC)集群遷移到云計(jì)算高性能計(jì)算(HPC)
北卡羅來納大學(xué)教堂山分校(UNC-Chapel Hill)長(zhǎng)期以來一直依靠其本地高性能計(jì)算(HPC)集群來支持多個(gè)科學(xué)、工程和醫(yī)學(xué)領(lǐng)域的研究活動(dòng)。然而,隨著研究計(jì)算需求的持續(xù)增長(zhǎng),用戶需求開始超過當(dāng)前系統(tǒng)的計(jì)算資源和容量。該大學(xué)并沒有增加現(xiàn)有的高性能計(jì)算(HPC)投資,而是決定采用云計(jì)算技術(shù)提供按需的高性能計(jì)算(HPC)環(huán)境。
實(shí)踐證明,該方法既具有成本效益,又具有高度靈活性。北卡羅來納大學(xué)教堂山分校首席信息官M(fèi)ichael Barker表示,“采用云計(jì)算,我們就可以提供完成所要求工作所需的計(jì)算工作。這是一種滿足運(yùn)行計(jì)算工作的需求非常有效的方式。”
該校高級(jí)研究助理Jeff Roach說,高性能計(jì)算(HPC)向云端遷移既是必要的,也是受歡迎的。他說,歐洲服務(wù)器,“我們有一個(gè)非常傳統(tǒng)的本地集群。然而隨著時(shí)間的推移,該系統(tǒng)逐漸無法跟上越來越多的需要領(lǐng)先計(jì)算能力和更快性能的用戶的步伐。我們發(fā)現(xiàn),本地集群對(duì)于設(shè)計(jì)該集群的人員確實(shí)非常有效,但是他們的一些案例正變得越來越少。”
隨著需要計(jì)算的用例迅速成為規(guī)范,北卡羅來納大學(xué)教堂山分校開始與谷歌云以及仿真和分析軟件提供商Techila科技公司合作,以規(guī)劃其進(jìn)入云計(jì)算高性能計(jì)算(HPC)的旅程。
其規(guī)劃之后的第一步是概念評(píng)估的證明。Roach說:“我們?cè)谛@里聘用了一位研究人員,他當(dāng)時(shí)采用配備大量?jī)?nèi)存的設(shè)備進(jìn)行交互式計(jì)算,我們?cè)噲D幫助完成他的工作量。”他指出這獲得很大成功。他說,“這名研究人員很快完成了工作,并且非常喜歡采用,這是因?yàn)椋嗤娜蝿?wù)在大學(xué)的高性能計(jì)算(HPC)本地集群上運(yùn)行可能要花費(fèi)一周的時(shí)間才能完成,而他采用云計(jì)算高性能計(jì)算(HPC)只用了幾個(gè)小時(shí)就可以完成。”