數(shù)據(jù)洪流下,AI、5G等新技術(shù)催生的創(chuàng)新應(yīng)用帶來更加多元化的計(jì)算需求,這就要求多樣化的計(jì)算架構(gòu)。為此,英特爾提出了“xPU”策略,也就是英特爾不再局限于CPU(向量計(jì)算),而是向GPU(矢量計(jì)算)、AI(矩陣計(jì)算)和FPGA(空間計(jì)算)進(jìn)行延展。
基于此,我們看到英特爾構(gòu)建了一個(gè)包含CPU、GPU、AI加速器、FPGA,以及如神經(jīng)擬態(tài)計(jì)算等面向未來的計(jì)算架構(gòu)。在這樣的計(jì)算架構(gòu)支撐下,我們正在邁入超異構(gòu)計(jì)算時(shí)代。
在超異構(gòu)計(jì)算時(shí)代,英特爾確立了制程和封裝、架構(gòu)、內(nèi)存和存儲、互連、安全、軟件六大技術(shù)支柱,全方位推動計(jì)算創(chuàng)新發(fā)展。在這其中,英特爾軟件是推動未來計(jì)算創(chuàng)新的隱形力量。
軟件加速硬件指數(shù)級創(chuàng)新
毋庸置疑,英特爾在硬件層面的創(chuàng)新是有目共睹的。但是進(jìn)入到超異構(gòu)計(jì)算時(shí)代,計(jì)算力指數(shù)級上升的實(shí)現(xiàn)一定是基于硬件與軟件的結(jié)合。所以英特爾借助“軟件先行”的戰(zhàn)略,推進(jìn)硬件和軟件的共同創(chuàng)新,來引領(lǐng)異構(gòu)計(jì)算的整合和創(chuàng)新,實(shí)現(xiàn)計(jì)算力指數(shù)級增長,滿足未來多元化的計(jì)算需求。
在以數(shù)據(jù)為中心的戰(zhàn)略指引下,英特爾不光在硬件層面進(jìn)行創(chuàng)新,還在軟件層面進(jìn)行投入。因?yàn)檎麄€(gè)計(jì)算架構(gòu)不是原來的單一CPU架構(gòu),需要針對不同的架構(gòu)和負(fù)載進(jìn)行整合,軟件在中間起了一個(gè)最關(guān)鍵的橋梁作用。
其實(shí),英特爾在軟件領(lǐng)域的投入是巨大。英特爾在全球大概十萬到十一萬人,免備案主機(jī),軟件工程師占到15%左右(15000名左右)。而在中國,英特爾亞太研發(fā)中心正式員工超過2000人,是涵蓋英特爾各個(gè)產(chǎn)品部在中國最大的、最完整的綜合性研發(fā)機(jī)構(gòu),擁有世界一流的工程研發(fā)能力。
英特爾通過軟件實(shí)現(xiàn)軟硬協(xié)同、生態(tài)共贏:提供簡便可擴(kuò)展的工具,來加速應(yīng)用開發(fā)部署;堅(jiān)持客戶至上,針對不同類型的工作負(fù)載進(jìn)行優(yōu)化;秉承開放理念,推動開源、開放生態(tài)系統(tǒng)協(xié)作;產(chǎn)學(xué)研對接,培育面向未來的創(chuàng)新人才。
在軟件生態(tài)構(gòu)件中,開發(fā)者是重要一環(huán)。英特爾已經(jīng)深入開發(fā)者生態(tài)領(lǐng)域超過20年,并有10000項(xiàng)與客戶緊密合作的軟件部署,是Linux Kernel最大的貢獻(xiàn)者,香港服務(wù)器租用,每年修改的代碼超過50萬行,為100多個(gè)操作系統(tǒng)進(jìn)行過優(yōu)化,并且擁有超過兩千萬活躍開發(fā)者的生態(tài),而這些只是英特爾龐大的軟件實(shí)力的一部分。英特爾跨基礎(chǔ)架構(gòu)、網(wǎng)絡(luò)、操作系統(tǒng)的開發(fā)經(jīng)驗(yàn),開發(fā)工具和SDK以及其所參與并影響的標(biāo)準(zhǔn)制定組織的數(shù)量在業(yè)界是無與倫比的。
基于這樣深厚的積淀,英特爾希望通過“統(tǒng)一架構(gòu)編程”,圍繞架構(gòu)創(chuàng)新進(jìn)行擴(kuò)展,并且讓所做的一切都是簡便和可擴(kuò)展的。英特爾軟件所做的事情使所有的硬件的每一個(gè)晶體管都能夠能力充分發(fā)揮起來,使得開發(fā)者能夠非常容易地把軟硬件充分用起來。
oneAPI打造統(tǒng)一架構(gòu)編程
跨架構(gòu)(CPU、GPU、FPGA及其他加速器)開發(fā)能力對于處理數(shù)據(jù)密集型工作負(fù)載極為重要,因?yàn)檫@種工作負(fù)載需要多種架構(gòu),這也將成為未來的常態(tài)。不過多架構(gòu)編程面臨諸多挑戰(zhàn)比如專用工作負(fù)載日益增多、尚無通用編程語言或 API、不一致的跨平臺工具支持、每個(gè)平臺需要單獨(dú)的軟件投資、需采用不同的以數(shù)據(jù)為中心的硬件等。
在今天,每一個(gè)硬件平臺往往需要開發(fā)者維護(hù)獨(dú)立的代碼庫,這些代碼庫需要使用不同的語言、庫和軟件工具進(jìn)行編程。這是一項(xiàng)極其復(fù)雜和耗費(fèi)時(shí)間的工作,會大大降低開發(fā)速度、抑制創(chuàng)新。
為了解決這樣的業(yè)界難題,英特爾發(fā)布了一項(xiàng)全新軟件行業(yè)計(jì)劃oneAPI。oneAPI為異構(gòu)計(jì)算提供了一個(gè)統(tǒng)一和簡化的應(yīng)用程序開發(fā)編程模型,這種統(tǒng)一性為開發(fā)者提供了一個(gè)統(tǒng)一的開發(fā)體驗(yàn),因?yàn)槠涿鎸Σ煌漠悩?gòu)硬件,他們不需要學(xué)習(xí)不同的編程方法。
具體來說,oneAPI基于標(biāo)準(zhǔn)的跨架構(gòu)語言Data Parallel C++和SYCL功能強(qiáng)大的API,旨在加速特定領(lǐng)域的主要功能底層硬件接口,可為供應(yīng)商提供硬件抽象層,支持針對不同的架構(gòu)和供應(yīng)商重復(fù)使用代碼。也就是說oneAPI支持直接編程和API編程,并提供統(tǒng)一的語言和庫,可以在包括CPU、GPU、FPGA和AI加速器等不同硬件架構(gòu)上提供完整的本地代碼性能。oneAPI的簡單易用和高性能讓開發(fā)者不再需要維護(hù)不同的代碼庫、多種編程語言以及不同的工具和工作流程。
英特爾對于未來計(jì)算的展望和承諾是:SVMS架構(gòu)(S是Scalar標(biāo)量,V是Vector向量,M是Matrix矩陣,S是Space空間),也就是我們前面提到的超異構(gòu)計(jì)算。而在SVNS架構(gòu)之上,英特爾構(gòu)建oneAPI,對這些硬件進(jìn)行了抽象。開發(fā)者針對的是這個(gè)抽象來寫程序,而不是具體的硬件。在oneAPI是框架和中間件框架提供了更高一層的抽象和語義,開發(fā)者可以在上面快速開發(fā),高效部署。