大國重器|超算:我們干成了“世界第一”

《中國經(jīng)濟(jì)周刊》 記者 鄭雪 | 北京報(bào)道

科技興則民族興,科技強(qiáng)則國家強(qiáng)。

超級計(jì)算機(jī)的發(fā)展關(guān)乎國家的科技未來,它是計(jì)算機(jī)領(lǐng)域“皇冠上的明珠”,是衡量一個(gè)國家科技水平的重要標(biāo)志。

作為大國重器,超級計(jì)算機(jī)多用于國家高科技領(lǐng)域和尖端技術(shù)研究,如航空航天、天體物理研究、氣象預(yù)報(bào)、潮汐預(yù)報(bào)等,其重要性不言而喻。

超級計(jì)算機(jī)的運(yùn)算速度有多快?以我國自主研制的首臺千萬億次超級計(jì)算機(jī)“天河一號”為例,其峰值運(yùn)算速度為4700萬億次/秒,60億人需要算一年的問題,超級計(jì)算機(jī)一秒就可以算完。

回顧中國超級計(jì)算機(jī)的發(fā)展史,“玻璃房”是無法被遺忘的過去。20世紀(jì)80年代,世界超級計(jì)算機(jī)技術(shù)飛速發(fā)展。西方國家長期對中國采取多邊出口管制政策。中國雖花了高價(jià)從美國購買超級計(jì)算機(jī),但相關(guān)性能受到閹割,設(shè)備需要放置于獨(dú)立的機(jī)房,機(jī)房鑰匙和啟動(dòng)密碼由美方掌握,上機(jī)需要美方人員審核監(jiān)督。

關(guān)鍵核心技術(shù)很難買到,中國要有自己的超級計(jì)算機(jī)。

1978年5月,國防科委在北京召開巨型機(jī)方案論證和協(xié)作會(huì)議,確定該機(jī)代號為“785工程” ,我國正式啟動(dòng)超級計(jì)算機(jī)研制工作。

一窮二白是當(dāng)時(shí)再真實(shí)不過的寫照。技術(shù)落后、資料匱乏,但攔不住下定決心攻關(guān)的科研人員?!熬扌陀?jì)算機(jī)之父”慈云桂更是立下軍令狀:“就算是豁出這條老命,也要把中國的巨型機(jī)搞出來?!?/p>

1983年12月,我國第一臺億次超級計(jì)算機(jī)“銀河一號”研制成功,中國成為繼美國、日本之后,第三個(gè)能獨(dú)立設(shè)計(jì)和制造超級計(jì)算機(jī)的國家。

以“銀河一號”為起點(diǎn),多方支持之下,中國超級計(jì)算機(jī)一步一個(gè)腳印,踏上自主創(chuàng)新、不斷超越的征程。

銀河、天河、神威等系列超級計(jì)算機(jī)產(chǎn)品逐漸大放光彩,國產(chǎn)超級計(jì)算機(jī)的運(yùn)算速度也實(shí)現(xiàn)了從千萬億次到億億次,再到百億億次的突破。

2010年,“天河一號”摘下全球超級計(jì)算機(jī)500強(qiáng)排行榜(以下簡稱“TOP500”)的桂冠;2013年研制成功的“天河二號”標(biāo)志著我國在超級計(jì)算機(jī)領(lǐng)域已走在世界前列;采用全自主創(chuàng)新的天河新一代超級計(jì)算機(jī)運(yùn)算速度達(dá)到百億億次。2016年6月,我國第一臺全部采用國產(chǎn)處理器構(gòu)建的超級計(jì)算機(jī)“神威·太湖之光”,以超第二名近3倍的運(yùn)算速度位列TOP500排行榜第一。

“神威·太湖之光”也是世界上首臺峰值運(yùn)算性能超過每秒十億億次浮點(diǎn)運(yùn)算能力的超級計(jì)算機(jī),曾獲得高性能計(jì)算應(yīng)用最高獎(jiǎng)“戈登·貝爾獎(jiǎng)”。

超級計(jì)算機(jī)發(fā)展已40余年,在一代又一代科研工作者的努力之下,中國的超級計(jì)算機(jī)已經(jīng)實(shí)現(xiàn)了從追趕到并跑,再到部分領(lǐng)跑的跨越。

孟祥飛 (右二) 和團(tuán)隊(duì)一起討論技術(shù)方案

親歷者:孟祥飛 國家超級計(jì)算天津中心黨組書記

2009年,博士畢業(yè)的我加入正在籌建的首個(gè)國家超算中心——國家超級計(jì)算天津中心(以下簡稱“天津超算中心”),參與研制、部署我國首個(gè)排名世界第一的超級計(jì)算機(jī)“天河一號”相關(guān)工作。這段經(jīng)歷讓我倍感驕傲和榮幸。

隨后,我又參與了超算的“二次創(chuàng)業(yè)”。十年磨一劍,國際真正認(rèn)可了我們在超級計(jì)算領(lǐng)域取得的成績。

目前,我國超算已經(jīng)實(shí)現(xiàn)了從追趕到并跑,再到部分領(lǐng)跑的跨越,不僅在于技術(shù),更在于軟件和應(yīng)用的突破。相關(guān)成績離不開一代又一代科研工作者的努力,更離不開科研工作者志氣、骨氣、底氣的傳承。

2022年,孟祥飛在公開活動(dòng)中介紹中國超級計(jì)算機(jī)的發(fā)展歷程。

沒想到我們竟干成了“世界第一”

2006年,我在天津南開大學(xué)攻讀理論物理博士,相關(guān)課題研究需要強(qiáng)大算力支撐,但當(dāng)時(shí)國內(nèi)并不具備這樣的條件。后來在國家留學(xué)基金委的支持下,我前往美國學(xué)習(xí)深造。

美國創(chuàng)新能力的平臺和環(huán)境讓我感受頗多。到達(dá)美國學(xué)習(xí)的第二年,我所在的實(shí)驗(yàn)室在理論物理領(lǐng)域的國際年會(huì)上共發(fā)布4個(gè)研究成果,其中兩個(gè)半由我主要完成,當(dāng)時(shí)非常有成就感。但同時(shí)我也看到了另一個(gè)問題:美國機(jī)構(gòu)的署名位列第一,我們所作的貢獻(xiàn)實(shí)在是給他人錦上添花。

學(xué)業(yè)結(jié)束之時(shí),美國導(dǎo)師希望我留美。迷茫之時(shí),一天散步的路上,我想起南開老校長的“愛國三問”,感覺到作為一個(gè)中國人,還沒對自己國家的創(chuàng)新發(fā)展作出貢獻(xiàn)。我決定回國,不管干多干少,都是我們自己的。

2009年,我加入天津超算中心,參與“天河一號”的研制和中心建設(shè)工作。

當(dāng)時(shí)面臨的挑戰(zhàn)不小,我們并未選擇當(dāng)時(shí)主流的環(huán)形架構(gòu)體系路線,而是采用CPU和GPU相結(jié)合的異構(gòu)融合計(jì)算體系結(jié)構(gòu)來做超級計(jì)算機(jī),我們是這條路線的“第一人”。

其實(shí),相關(guān)研究工作從2007年便已開始,為了完成相關(guān)任務(wù),整個(gè)研發(fā)團(tuán)隊(duì)選擇“閉關(guān)”,通過關(guān)鍵底層技術(shù),如軟硬件設(shè)計(jì)、操作系統(tǒng)、編譯器、軟硬件的協(xié)同調(diào)度等,驗(yàn)證了我們的方向是正確的。

2009年夏天,我們啟動(dòng)基礎(chǔ)環(huán)境建設(shè)和整機(jī)系統(tǒng)安裝工作。我們需要完成上萬根光纖、上噸重機(jī)柜的部署和安裝。在接近40℃的房間里,累了就睡在地上,醒了再接著干。設(shè)備安裝過程中,有些快要退休的老專家,也在一線跟我們拉光纖、搬機(jī)柜,讓當(dāng)時(shí)的我受到了教育。

就這樣,我們用了7個(gè)月左右的時(shí)間,完成了別人要一年半以上時(shí)間才能完成的部署任務(wù),中國首臺千萬億次超級計(jì)算機(jī)“天河一號”誕生了。

2010年11月,全球超級計(jì)算機(jī)500強(qiáng)排行榜公布,“天河一號”勇奪第一。

消息傳來已是晚上,我正和幾個(gè)同事值班,聽到這個(gè)消息之后,非常激動(dòng)興奮,從來沒想到我們的團(tuán)隊(duì)竟然干成了世界第一的工程。我和同事一起振臂高呼之后,繞著我們“天河一號”跑了幾圈,對于平時(shí)淡定的我來說,已經(jīng)很是“超綱”了。

“二次創(chuàng)業(yè)”讓中國超算真正站穩(wěn)腳跟

但很快,“中看不中用”的質(zhì)疑接踵而來。國際專家質(zhì)疑我們造了個(gè)“跑車”,只是為了快而快;國內(nèi)也有人質(zhì)疑我們造了個(gè)大型“游戲機(jī)”。

原因是,超算技術(shù)雖然突破了,但當(dāng)時(shí)也面臨著挑戰(zhàn):一是當(dāng)時(shí)的超算應(yīng)用基礎(chǔ)不足,二是軟件層面、算法模型尚未有所變化。

對我們來說,真正難的還是要實(shí)現(xiàn)應(yīng)用創(chuàng)新的“二次突破”,即把超算真正轉(zhuǎn)化為創(chuàng)新力和生產(chǎn)力。

“二次突破”交到了我們年輕團(tuán)隊(duì)手中。作為應(yīng)用研發(fā)團(tuán)隊(duì)的負(fù)責(zé)人,面對質(zhì)疑情緒容易“上頭”的我立了軍令狀:干不好“天河一號”的應(yīng)用,我卷鋪蓋走人。

我們打造了售前、售后、研發(fā)的全方位團(tuán)隊(duì),帶著售前團(tuán)隊(duì)出去摸需求、做推廣,負(fù)責(zé)超算系統(tǒng)、能力、創(chuàng)新的推廣工作。我們坐著綠皮火車每年跑幾十個(gè)城市,開上百場報(bào)告會(huì)或者交流會(huì),讓大家了解超級計(jì)算機(jī)。

售后、研發(fā)團(tuán)隊(duì)主要開發(fā)超算的技術(shù)服務(wù)能力,摸清實(shí)踐和產(chǎn)業(yè)需求,用我們的超算平臺解決需求,或者根據(jù)需求重新研發(fā)運(yùn)行軟件或者模型,以解決科技創(chuàng)新和產(chǎn)業(yè)的問題。

正是過去這些年,我們把超級計(jì)算機(jī)打造成了能夠算天、算地、算人的大國重器。

算天,應(yīng)用于諸如航空航天飛行模式、天氣預(yù)報(bào)預(yù)測等。算地,應(yīng)用于石油勘探、大壩抗震分析等。算人,可應(yīng)用于藥物研發(fā)、大規(guī)模基因數(shù)據(jù)的分析。

算力真正轉(zhuǎn)化成了創(chuàng)新力和生產(chǎn)力,實(shí)現(xiàn)了二次創(chuàng)新,各類生態(tài)自然而然涌現(xiàn)出來。圍繞超算發(fā)展,國內(nèi)芯片、操作系統(tǒng)、服務(wù)器等領(lǐng)域涌現(xiàn)了一大批信息技術(shù)企業(yè),為中國信創(chuàng)產(chǎn)業(yè)發(fā)展奠定了基礎(chǔ)。

“二次創(chuàng)業(yè)”讓中國超算真正站穩(wěn)了腳跟。從2010年以來,十年磨一劍,國際范圍內(nèi)真正認(rèn)可了中國在超算領(lǐng)域取得的成績。

現(xiàn)在來看,中國超算的發(fā)展體現(xiàn)了三個(gè)“氣”:

志氣,“天河一號”搭載的異構(gòu)融合計(jì)算體系結(jié)構(gòu)成為世界第一并引領(lǐng)國際超算潮流,體現(xiàn)我們向前邁進(jìn)、勇爭領(lǐng)域前列的志氣。

骨氣,剛起步的時(shí)候我們一窮二白,前輩們接受這個(gè)任務(wù)并立下軍令狀,挑戰(zhàn)不可能。

底氣,全自主創(chuàng)新的天河新一代超級計(jì)算機(jī),讓我們在高度競爭的超算領(lǐng)域更有底氣。

當(dāng)然,超級計(jì)算也面臨著新的挑戰(zhàn):摩爾定律面臨終結(jié)挑戰(zhàn),計(jì)算范式出現(xiàn)了變化;人工智能快速發(fā)展,需要大規(guī)模低精度混合計(jì)算支持,超算需要思考如何與智算融合;此外,量子計(jì)算興起,未來超算需與其協(xié)同發(fā)展。當(dāng)下,我們在設(shè)計(jì)新一代超級計(jì)算機(jī)的時(shí)候,已經(jīng)提前考慮這些問題了。

(本文刊發(fā)于《中國經(jīng)濟(jì)周刊》2024年第18期)


頂部