基于云的超級(jí)計(jì)算是指在云端執(zhí)行高性能計(jì)算,允許多個(gè)用戶共享一臺(tái)超級(jí)計(jì)算機(jī),同時(shí)確保每個(gè)工作負(fù)載的隱私和安全。
基于云的超級(jí)計(jì)算機(jī)如何工作?
云原生超級(jí)計(jì)算機(jī)的架構(gòu)比傳統(tǒng)超級(jí)計(jì)算機(jī)具有更高效的性能。它們并行管理計(jì)算和通信,使繁重的工作負(fù)載能夠更順暢地處理。那是因?yàn)樗麄兪褂萌N處理器——CPU、DPU 和通常是 GPU 的加速器。讓我們檢查一下這三個(gè)中的每一個(gè)的作用。
- CPU: CPU 是為需要快速串行處理的算法部分構(gòu)建的。然而,由于超級(jí)計(jì)算中的計(jì)算任務(wù)要復(fù)雜得多,CPU 通常會(huì)承擔(dān)管理越來(lái)越大和復(fù)雜的系統(tǒng)所需的越來(lái)越多的通信任務(wù)層。事實(shí)上,在傳統(tǒng)的超級(jí)計(jì)算機(jī)上,計(jì)算工作有時(shí)需要等待 CPU 處理通信任務(wù)。
- DPU: DPU,即數(shù)據(jù)處理單元,是一種片上數(shù)據(jù)中心平臺(tái),可提供基礎(chǔ)設(shè)施服務(wù)、管理所有配置、虛擬化和硬件。它為每個(gè)超級(jí)計(jì)算節(jié)點(diǎn)提供了兩種新功能:一種是啟用裸機(jī)多租戶,另一種是啟用裸機(jī)性能。在第一種情況下,基礎(chǔ)設(shè)施控制平面處理器保護(hù)計(jì)算節(jié)點(diǎn)的用戶訪問(wèn)、存儲(chǔ)訪問(wèn)、網(wǎng)絡(luò)和生命周期編排。在第二種情況下,隔離的線速數(shù)據(jù)路徑允許硬件加速。這允許 CPU 卸載例行任務(wù),而是專注于處理任務(wù),從而最大限度地提高整體系統(tǒng)性能。
- GPU:云原生超級(jí)計(jì)算中的GPU充當(dāng)通用協(xié)處理器引擎。他們使用圖形處理單元通過(guò)并行運(yùn)行多個(gè)搜索來(lái)加速在 CPU 上運(yùn)行的應(yīng)用程序。
超級(jí)計(jì)算與云計(jì)算
超級(jí)計(jì)算和云計(jì)算之間的區(qū)別純粹是規(guī)模的衡量標(biāo)準(zhǔn)。雖然企業(yè)云計(jì)算為企業(yè)創(chuàng)造了吸引客戶的新方式并顛覆了組織管理數(shù)據(jù)、DevOps 和整體 IT 運(yùn)營(yíng)的方式,但超級(jí)計(jì)算將研發(fā)(研發(fā))速度和產(chǎn)品開(kāi)發(fā)速度提高了幾個(gè)數(shù)量級(jí)。很簡(jiǎn)單,通過(guò)每秒處理數(shù)萬(wàn)億次操作,超級(jí)計(jì)算改變了創(chuàng)新的步伐和動(dòng)力。
云計(jì)算將整套計(jì)算服務(wù)——服務(wù)器、存儲(chǔ)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、軟件、分析和智能——帶到了互聯(lián)網(wǎng)上。任何類型的計(jì)算服務(wù)都托管在云中,而不是使用本地環(huán)境,這樣多個(gè)用戶可以隨時(shí)同時(shí)訪問(wèn)它們,而沒(méi)有容量過(guò)載的風(fēng)險(xiǎn)。這創(chuàng)造了一個(gè)全新的可擴(kuò)展性和效率的世界,繼續(xù)使組織能夠?qū)崿F(xiàn)運(yùn)營(yíng)現(xiàn)代化。
將超級(jí)計(jì)算機(jī)的巨大處理能力與云的規(guī)模和內(nèi)在聯(lián)系的自然聯(lián)系起來(lái),為科學(xué)和工程開(kāi)辟了一個(gè)全新的可能性領(lǐng)域。云原生超級(jí)計(jì)算支持從軟件到藥物再到原型的快速模擬,加快了公司將新產(chǎn)品創(chuàng)新商業(yè)化的步伐,科學(xué)家們可以在健康、空間、能源等領(lǐng)域取得突破。