7月2日,2019/34594.html">2019可信云大會在北京國際會議中心隆重開幕。2019/34594.html">2019可信云大會以“2017/12452.html">智能云網邊,可信創未來”為主題,由中國信息通信研究院主辦。
下午13:30大會特設的2017/12452.html">智能云論壇活動正式開始,來自北京航空航天大學教授,計算機學院中德聯合軟件研究所所長劉軼做了《高性能計算的現狀與未來》的精彩演講。
北京航空航天大學教授,計算機學院中德聯合軟件研究所所長劉軼
很高興今天有機會跟大家分享這個報告。我今天報告的題目是“高性能計算的現狀與未來”。今天是2017/12452.html">智能云論壇,所以簡單談一下高性能計算和人工智能的關系。
高性能計算發展現狀
在高性能計算領域有一個Top500排行榜,每年6月下旬和11月下旬分別發布兩次排行榜,代表全世界目前性能最好500臺超級計算機。
我們統計Top500性能增長的趨勢,橫軸是時間,最近幾十年來,高性能計算機性能長期維持十年千倍的增長速度,也就是說高性能計算機的性能市面上最高性能的超級計算機每十年增長千倍,超過摩爾定律增長速度。
曲線上,從2013年開始性能增長趨緩,2013年開始降到十年百倍,主要是由于處理器性能的增長,隨著集成電路領域在講摩爾定律終結問題,高性能計算機性能還有進一步放緩的趨勢,這是整個增長的趨勢。
最新發布的Top500排行榜中前10名機器表格(6月17號剛發布的排行榜)。排名前10機器中,前2名是美國機器,第3、第4是中國。
2018年6月份,中國太湖之光第一,去年美國Summit沖到第一,Seierra到了第二,我們現在是第三、第四的排行。
排行榜地點是機器安裝位置,主要在美國、歐洲等國家。
峰值性能。計算機領域處理器、浮點運算次數有一個理論的峰值性能,但這個排行榜是通過一個測試程序測到的性能來排名的,更全面、更綜合考察這臺超級計算機綜合性能,包括體系結構等各方面綜合性能。
目前世界第一的Summit臺計算機峰值達到200PF。Linpack性能達到140多PF水平。這個機器的構成,尤其處理器,前10機器只有2臺是所謂同構純CPU機器,第5機器和第9機器純粹用英特爾CPU搭出來,其他都是異構和加速的結構,太湖之光和天河二號要么是異構,要么是加速器的結構。
功耗。現在排名靠前的機器功耗一般都到10兆瓦上下量級。按照國別排行,即這些機器放在不同國家,有一個說法是Top500排行里存在所謂三個世界,第一世界占據了絕大多數資源。今年有一個很有趣的現象,按系統數量,即按機器數量,中國已經占到第一,超過了美國,中國占到500臺中的200多臺,中美兩個國家在Top500中占了一大半。有一個說法:中國在超算上超過了美國,但沒有這么樂觀。
另外一個統計曲線,按照性能合計。左圖按照臺數,Top500里中國占200多臺,將其性能加到一起,和美國相比,反過來了,說明中國在Top500里的機器數量相對比美國多,但性能加到一起比不過美國,也就是美國比較靠前。代表Top500里所謂超級計算機有相當多是互聯網企業,國內互聯網公司做云計算,性能相對來講是中小規模的性能更多一些。
按廠商做統計,排名前三中國廠商,聯想、浪潮、曙光三家企業在系統數量里占到了34%,是第一大。在今年6月下旬超算大會上,有一個話題專門講的是中國現在已經成為了高性能計算最大的生產者,最大的消費者。生產者體現在中國的廠商在高性能計算機制造系統里已經占到了第一。
從性能來看,還是最高,但比例占得小多了,可以看出這三家企業生產的高性能計算機數量比較多,但整體機器規模相對比較小。在國內目前排名前2位的太湖之光和天河二號都不是這三家廠商生產出來的。
世界上最先進的超級計算機是什么樣子?
排名第一的美國Summit,美國超級計算機主要是由所謂DOE(能源部)主導,能源部下屬有若干個國家實驗室,由它來運營和管理這些機器,Summit這臺機器安裝在美國能源部橡樹嶺國家實驗室。在美國二戰時,曼哈頓計劃設立了橡樹嶺國家實驗室。
這個機器一共有4608個節點,每個節點是典型的集群結構,跟云計算非常相近。
如圖,節點俯視圖。這個機器是2個CPU+6個GPU,跟通常大家見到的集群節點的區別:第一,CPU不是英特爾CPU,而是IBM的PowerCPU,GPU用的是V100;第二,這個用了GPU自帶上午高速互聯接口,IBM為它專門設計了主板,CPU跟GPU之間互聯數據通路打通,完全用高爐通道實現互聯。這里沒有散熱風扇,用的液冷。整個樣子跟云計算數據中心很相近,一排一排機柜,但采用液冷,噪音比較低。
互聯網用的是InfiniBand,是典型的集群結構。操作系統是:RedHat。