6月25日, “超級計算機500強”(TOP500)最新榜單正式發布。時隔五年,美國超級計算機“Summit”終于超越中國超算神威·太湖之光,重回第一。
美國超算卷土重來意味著什么?中國還有反超的機會嗎?超算未來的發展趨勢是怎樣的?為此,大院er訪問了中國科學院計算技術研究所的張云泉研究員。
圖1 6月25日公布的超算TOP500的前十名
問:在最近的超算排行榜上,美國多年后重回榜首,意味著什么?
答: 超算TOP500每年發布兩次,我們國家的天河2號和太湖之光,分別六次和四次拿到冠軍,一共十次,相當于連續五年占據了TOP500的冠軍位置。
圖2 超級計算機“神威·太湖之光”
美國政府為此很著急。之前由于奧巴馬政府對超算不夠重視,奧巴馬只是在第二個任期快結束的時候才發布了一項總統令,加快超算研制的創新步伐。 而特朗普就任以后,卻對超算極其重視,在砍掉了很多科學研究預算的情況下,超算的預算不但沒砍,反而增加了。
幾年前,美國部署了三臺百P(相當于十億億次)量級的超級計算機,每秒的運算速度可以達到100P到200P左右,分別是Summit、Sierra、Aurora三臺機器。目標有三個:第一當然是為美國的國家實驗室研發世界領先的超級計算模擬系統,保持美國科學創新的領導地位;第二是希望保持美國在超級計算機研制上的技術優勢和領先水平;第三就是希望把TOP500第一的位置奪回來。為此美國大概撥款了5個億美元的預算,計劃在2018年年底推出第一臺機器,重返Top500榜首。
但是美國終究無法繼續容忍中國再霸占世界TOP500的冠軍位置半年,將原來的計劃提前了半年,于今年6月份就調整計劃推出了Summit、Sierra兩臺機器,作為雙保險爭奪世界第一,Summit直接將峰值性能提升到200P,終于如愿奪回世界第一的位置,美國終于松了一口氣,重新找到老大的感覺。其實美國最早是想用峰值180P的Aurora來作為種子選手爭奪世界第一的,但是由于英特爾負責研制的新Xeon Phil加速器無法按期完成,只好修改合同,直接去研發2021年完成的百億億次超級計算機A21。
圖3 美國超級計算機Summit
問:中國在超算領域的實力到底怎么樣?未來要解決哪些問題?
答: 如果畫一條中國超算的性能發展曲線的話,可以看到,中國的超算實際上是從一窮二白做起的。在2002年之前,TOP500上就沒有中國的超算,或者說中國超算本身就很少。從2002年之后,經過15年的高速發展,中國超算的上榜數量,包括性能都是指數級增長,以旱地拔蔥的方式一躍而起。
圖4 中國超算的跨越式發展
原來是美日歐三大集團瓜分世界超算TOP500的前三名,像馬拉松一樣,他們平穩地跑在第一方陣。而中國就屬于從隊尾直接沖到了第一方陣中的選手,我們超過了第三名的歐盟,國內服務器租用 服務器托管,超過了第二名的日本,最后又超過了美國,成為世界第一。15年的時間很不容易,從一窮二白到最后成為世界第一,中國超算機器的研發水平,現在確實是世界領先的,處在第一方陣的靠前水平。
但是我們也面臨很多的困擾,我們的機器發展比較快,但是相應的應用和軟件研制這塊有點滯后,沒有完全跟上,可能有投資原因,還有各種人才培養周期的原因。但是現在我們也在積極的解決這些問題,后期國家對軟件研發、對人才的培養都加大了投資力度。這些問題還需要5到10年的時間去解決,達到平衡狀態。
中國超算走過了一條比較特殊的路,就是機器發展拉動應用需求,也就是說我們機器的水平是超過了應用需求的。這是一種政府主導的快速發展模式。這個路現在是比較成功的。我們機器發展比較快,也帶動應用的水平快速提升。但是未來我們希望能夠用5到10年的時間,把這種發展模式轉變成應用需求來拉動機器發展,這樣更科學更合理。這種發展模式,也是西方發達國家現在的發展模式。
現在來看,我們已經連續兩年拿了戈登貝爾獎(編者注:該獎設立于1987年,主要頒發給高性能應用領域最杰出成就,通常會由當年TOP500排行名列前茅的計算機系統的應用獲得),說明應用水平提高還是很快的!
圖5 中國團隊獲得戈登貝爾獎
問:據說中國9月份就可以重回 TOP500 的榜首了,是真的嗎?