7月2日,2019/34594.html">2019可信云大會(huì)在北京國(guó)際會(huì)議中心隆重開(kāi)幕。2019/34594.html">2019可信云大會(huì)以“2017/12452.html">智能云網(wǎng)邊,可信創(chuàng)未來(lái)”為主題,由中國(guó)信息通信研究院主辦。
下午13:30大會(huì)特設(shè)的2017/12452.html">智能云論壇活動(dòng)正式開(kāi)始,來(lái)自北京航空航天大學(xué)教授,計(jì)算機(jī)學(xué)院中德聯(lián)合軟件研究所所長(zhǎng)劉軼做了《高性能計(jì)算的現(xiàn)狀與未來(lái)》的精彩演講。
北京航空航天大學(xué)教授,計(jì)算機(jī)學(xué)院中德聯(lián)合軟件研究所所長(zhǎng)劉軼
很高興今天有機(jī)會(huì)跟大家分享這個(gè)報(bào)告。我今天報(bào)告的題目是“高性能計(jì)算的現(xiàn)狀與未來(lái)”。今天是2017/12452.html">智能云論壇,所以簡(jiǎn)單談一下高性能計(jì)算和人工智能的關(guān)系。
高性能計(jì)算發(fā)展現(xiàn)狀
在高性能計(jì)算領(lǐng)域有一個(gè)Top500排行榜,每年6月下旬和11月下旬分別發(fā)布兩次排行榜,代表全世界目前性能最好500臺(tái)超級(jí)計(jì)算機(jī)。
我們統(tǒng)計(jì)Top500性能增長(zhǎng)的趨勢(shì),橫軸是時(shí)間,最近幾十年來(lái),高性能計(jì)算機(jī)性能長(zhǎng)期維持十年千倍的增長(zhǎng)速度,也就是說(shuō)高性能計(jì)算機(jī)的性能市面上最高性能的超級(jí)計(jì)算機(jī)每十年增長(zhǎng)千倍,超過(guò)摩爾定律增長(zhǎng)速度。
曲線上,從2013年開(kāi)始性能增長(zhǎng)趨緩,2013年開(kāi)始降到十年百倍,主要是由于處理器性能的增長(zhǎng),隨著集成電路領(lǐng)域在講摩爾定律終結(jié)問(wèn)題,高性能計(jì)算機(jī)性能還有進(jìn)一步放緩的趨勢(shì),這是整個(gè)增長(zhǎng)的趨勢(shì)。
最新發(fā)布的Top500排行榜中前10名機(jī)器表格(6月17號(hào)剛發(fā)布的排行榜)。排名前10機(jī)器中,前2名是美國(guó)機(jī)器,第3、第4是中國(guó)。
2018年6月份,中國(guó)太湖之光第一,去年美國(guó)Summit沖到第一,Seierra到了第二,我們現(xiàn)在是第三、第四的排行。
排行榜地點(diǎn)是機(jī)器安裝位置,主要在美國(guó)、歐洲等國(guó)家。
峰值性能。計(jì)算機(jī)領(lǐng)域處理器、浮點(diǎn)運(yùn)算次數(shù)有一個(gè)理論的峰值性能,但這個(gè)排行榜是通過(guò)一個(gè)測(cè)試程序測(cè)到的性能來(lái)排名的,更全面、更綜合考察這臺(tái)超級(jí)計(jì)算機(jī)綜合性能,包括體系結(jié)構(gòu)等各方面綜合性能。
目前世界第一的Summit臺(tái)計(jì)算機(jī)峰值達(dá)到200PF。Linpack性能達(dá)到140多PF水平。這個(gè)機(jī)器的構(gòu)成,尤其處理器,前10機(jī)器只有2臺(tái)是所謂同構(gòu)純CPU機(jī)器,第5機(jī)器和第9機(jī)器純粹用英特爾CPU搭出來(lái),其他都是異構(gòu)和加速的結(jié)構(gòu),太湖之光和天河二號(hào)要么是異構(gòu),要么是加速器的結(jié)構(gòu)。
功耗。現(xiàn)在排名靠前的機(jī)器功耗一般都到10兆瓦上下量級(jí)。按照國(guó)別排行,即這些機(jī)器放在不同國(guó)家,有一個(gè)說(shuō)法是Top500排行里存在所謂三個(gè)世界,第一世界占據(jù)了絕大多數(shù)資源。今年有一個(gè)很有趣的現(xiàn)象,按系統(tǒng)數(shù)量,即按機(jī)器數(shù)量,中國(guó)已經(jīng)占到第一,超過(guò)了美國(guó),中國(guó)占到500臺(tái)中的200多臺(tái),中美兩個(gè)國(guó)家在Top500中占了一大半。有一個(gè)說(shuō)法:中國(guó)在超算上超過(guò)了美國(guó),但沒(méi)有這么樂(lè)觀。
另外一個(gè)統(tǒng)計(jì)曲線,按照性能合計(jì)。左圖按照臺(tái)數(shù),Top500里中國(guó)占200多臺(tái),將其性能加到一起,和美國(guó)相比,反過(guò)來(lái)了,說(shuō)明中國(guó)在Top500里的機(jī)器數(shù)量相對(duì)比美國(guó)多,但性能加到一起比不過(guò)美國(guó),也就是美國(guó)比較靠前。代表Top500里所謂超級(jí)計(jì)算機(jī)有相當(dāng)多是互聯(lián)網(wǎng)企業(yè),國(guó)內(nèi)互聯(lián)網(wǎng)公司做云計(jì)算,性能相對(duì)來(lái)講是中小規(guī)模的性能更多一些。
按廠商做統(tǒng)計(jì),排名前三中國(guó)廠商,聯(lián)想、浪潮、曙光三家企業(yè)在系統(tǒng)數(shù)量里占到了34%,是第一大。在今年6月下旬超算大會(huì)上,有一個(gè)話題專門(mén)講的是中國(guó)現(xiàn)在已經(jīng)成為了高性能計(jì)算最大的生產(chǎn)者,最大的消費(fèi)者。生產(chǎn)者體現(xiàn)在中國(guó)的廠商在高性能計(jì)算機(jī)制造系統(tǒng)里已經(jīng)占到了第一。
從性能來(lái)看,還是最高,但比例占得小多了,可以看出這三家企業(yè)生產(chǎn)的高性能計(jì)算機(jī)數(shù)量比較多,但整體機(jī)器規(guī)模相對(duì)比較小。在國(guó)內(nèi)目前排名前2位的太湖之光和天河二號(hào)都不是這三家廠商生產(chǎn)出來(lái)的。
世界上最先進(jìn)的超級(jí)計(jì)算機(jī)是什么樣子?
排名第一的美國(guó)Summit,美國(guó)超級(jí)計(jì)算機(jī)主要是由所謂DOE(能源部)主導(dǎo),能源部下屬有若干個(gè)國(guó)家實(shí)驗(yàn)室,由它來(lái)運(yùn)營(yíng)和管理這些機(jī)器,Summit這臺(tái)機(jī)器安裝在美國(guó)能源部橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室。在美國(guó)二戰(zhàn)時(shí),曼哈頓計(jì)劃設(shè)立了橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室。
這個(gè)機(jī)器一共有4608個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)是典型的集群結(jié)構(gòu),跟云計(jì)算非常相近。
如圖,節(jié)點(diǎn)俯視圖。這個(gè)機(jī)器是2個(gè)CPU+6個(gè)GPU,跟通常大家見(jiàn)到的集群節(jié)點(diǎn)的區(qū)別:第一,CPU不是英特爾CPU,而是IBM的PowerCPU,GPU用的是V100;第二,這個(gè)用了GPU自帶上午高速互聯(lián)接口,IBM為它專門(mén)設(shè)計(jì)了主板,CPU跟GPU之間互聯(lián)數(shù)據(jù)通路打通,完全用高爐通道實(shí)現(xiàn)互聯(lián)。這里沒(méi)有散熱風(fēng)扇,用的液冷。整個(gè)樣子跟云計(jì)算數(shù)據(jù)中心很相近,一排一排機(jī)柜,但采用液冷,噪音比較低。
互聯(lián)網(wǎng)用的是InfiniBand,是典型的集群結(jié)構(gòu)。操作系統(tǒng)是:RedHat。