中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

    <sub id="dxmnt"><ol id="dxmnt"></ol></sub>

      1. 偶然當程序員卻拿下圖靈獎,超算榜單之父講述人生開掛經(jīng)歷

        更新時間:2022-12-10 18:06:38作者:智慧百科

        偶然當程序員卻拿下圖靈獎,超算榜單之父講述人生開掛經(jīng)歷

        40年前偶然走上程序員道路的Jack Dongarra,是今年的圖靈獎得主。

        獎項設立機構美國計算機協(xié)會(ACM)表示,Dongarra的算法與軟件成果推動了高性能計算(HPC)的發(fā)展。

        正是他在數(shù)值算法和庫上的開創(chuàng)性貢獻,使得過去40年里,高性能計算軟件追上了指數(shù)級硬件發(fā)展的節(jié)奏。



        這位老爺子,還弄出了個TOP500的超算排行榜,每年兩次幫超算跑跑分啥的。

        剛剛,今年71歲的老爺子還參加了中國計算機學會舉辦的CNCC 2022,做了次特邀報告演講。

        演講的主題,也與高性能計算息息相關。

        為什么人類需要超算?

        高性能計算 ,是指通過聚合計算能力來提供比傳統(tǒng)計算機和服務器更強大的計算性能。

        再通俗點來講,就是用超級計算機來并行處理復雜問題。

        為什么要用上超算?Jack Dongarra舉了個例子。

        他提到,科學和工程都通過理論和實驗來推進,但兩者常常遭遇限制,尤其是實驗部分。

        會遭遇的“攔路虎”非常多,有可能是制造儀器很難搞,有可能是所觀察的事物發(fā)展太過迅猛,又或者是沒有辦法在實驗室里完成實驗。

        比如,假設有兩個星系會發(fā)生碰撞,這個過程會是什么?

        與其只靠漫長的觀測,不如在計算機上進行仿真模擬。

        計算科學增強著當下的種種理論和實驗,最快的超級計算機能為仿真模擬提供非常好的保真度和準確性,更重要的是,超算能夠覆蓋和支持仿真模擬過程中巨大的計算量。

        這就不得不提到超算的結構。

        超算由一堆CPU、GPU等異構芯片提供算力。

        此外,它擁有一個高度并行的系統(tǒng)和分布式內存。為超算編程時,會用到MPI(用于編寫并行計算機的跨語言通訊協(xié)議),以及用于共享內存并行系統(tǒng)的多線程程序設計方案OpenMP。

        美國橡樹嶺國家實驗室的超級計算機Frontier取得了斐然的成績:在2022年第59屆國際超算Top500名單中位居榜首。

        Frontier大約有800萬個核,9408個節(jié)點,它在負載下的電力是21兆瓦。

        Jack Dongarra打了個頑皮的比方。

        他說,在美國,如果他家用掉1兆瓦的電力,一年得給電力公司繳納100萬美元的電費。

        也就是說,單是電費,F(xiàn)rontier一年就要花掉2100萬美元呢!



        Frontier的最高性能是每秒2x1018次浮點運算。

        這是一個難以置信的計算量。如果現(xiàn)在全球所有人停下手里的工作,開始每秒做一次計算,晝夜不停、不眠不休地計算四年,才能達到1018次浮點運算。然而,這樣龐大的運算量,超算一秒就能完成。

        除了計算,超算還涉及異構數(shù)據(jù)在不同芯片間的搬運,Jack Dongarra稱之為移動數(shù)據(jù)(data moving)

        Jack Dongarra指出,現(xiàn)在的超算對已經(jīng)對浮點運算做了大量優(yōu)化,移動數(shù)據(jù)的成本已經(jīng)比計算成本還高。

        降低移動數(shù)據(jù)的成本,將成為未來重點的研究方向。

        此外,AI for Science已經(jīng)在很多科學領域發(fā)揮重要作用,譬如DeepMind旗下的Alpha系列,如Alpha Zero、AlphaStar、AlphaTensor……

        今年推出的Alphafold2,其蛋白質結構數(shù)據(jù)庫揭開了蛋白質宇宙,有人因此戲稱“結構生物學家要失業(yè)了”。

        超算的另一個發(fā)展方向,就是更適合做AI計算。

        AI有很多方面,有ML、NLP、專家系統(tǒng)、CV、語音、機器人等。

        Jack Dongarra給出了超算適合做AI計算的理由。

        首先,互聯(lián)網(wǎng)上存在的大量數(shù)據(jù),可以用來訓練和建立ML算法,與此同時,因為提升洞察力,ML已經(jīng)成為了解決問題時所要考慮的“基礎設施”之一。

        而關于用來做ML計算內核的GPU,人類也對其背后的算法和理論有了更深度的了解。

        ML的核心是矩陣,線性代數(shù)在其中扮演著重要的角色。

        “8位浮點(FP8)精度很適用于訓練神經(jīng)網(wǎng)絡的硬件。”

        Jack Dongarra對此進行了進一步解釋:

        相比于16位、32位的浮點精度,較低的精度正是ML所需要的。
        這就是為什么現(xiàn)在更多的計算機被設計用來專門解決ML的問題。

        他還提到,未來的超算或許會擁有更多的加速器,它們可以用來進行ML、神經(jīng)神態(tài)計算、量子計算、光學計算等。

        “從標量到向量,從向量到分布式內存,從分布式內存到加速計算,再到使用混合精度來進行計算?!盝ack Dongarra總結道,“我得出結論,這里有三場計算機革命?!?/p>

        意外走上漫漫超算路

        拿下圖靈獎的Jack Dongarra并非一開始就以當程序員為己任,一切都是“意外”。

        高中畢業(yè)后,他選擇進入芝加哥州立大學就讀——這所學校類似于地方性的師范學校,為芝加哥公立學校系統(tǒng)培養(yǎng)了不少教師。

        大三、大四時,Jack Dongarra福至心靈地“醒悟”,發(fā)現(xiàn)自己并不想教書。

        幾經(jīng)周折,他申請了阿貢國家實驗室的本科生職位。在那里,他有機會和真正的科學家一起做一些實際工作,并獲取課程學分。

        于是,就讀于芝加哥州立大學的最后一個學期,Jack Dongarra在阿貢國家實驗室度過了16周左右的時間。

        △1980年Dongarra在阿貢國家實驗室

        在阿貢國家實驗室的這段經(jīng)歷,促使他決心轉攻計算機。

        本科畢業(yè)之后,先在在伊利諾伊理工學院拿到CS碩士學位,又進入新墨西哥大學繼續(xù)深造。

        這里有一張1979年拍攝的照片,左數(shù)第二個年輕小伙就是Jack Dongarra本人。

        那個時候,作為新墨西哥大學研究生的他,頭發(fā)還很茂盛(他自己說的)。

        圖上四人搞了個小組,開發(fā)了一個叫LINPACK的項目,為此,Jack Dongarra還給自己心愛的車車掛上了同名車牌。

        具體來說,LINPACK是一套求解線性方程組的數(shù)學軟件。

        沒錯,那個時候小帥哥本人真正醉心的還是線性代數(shù)領域。

        他曾這樣描述自己40年來成為程序員的動力:

        我主攻的是數(shù)學方面的研究,尤其是數(shù)值線性代數(shù)方面,我所有的工作都源于此。
        對那些需要解線性方程組的學科來說,一款能計算答案的軟件無疑是非常重要的。
        同時,你還必須確保軟件運行與機器架構相一致,這樣才能真正獲得機器所能達到的高性能。

        1993年,Jack Dongarra加入了TOP500排行榜團隊,成為了TOP500第一個測試版本的爸爸之一。

        同年6月,正式版本開始發(fā)布,其所所使用的評選標準被稱為LINPACK。

        自那時起,TOP500排行榜半年發(fā)布一次,告訴大家世界最強大的計算設備都在哪里。



        這一舉措解決了科學家們無法就衡量超級計算機進展的標準達成一致的問題。

        負責監(jiān)督美國能源部“百百億次計算”項目的Paul Messina就表示:

        “如果你不能測量它,你就不知道它是什么”,這就是為什么杰克的工作很重要。

        現(xiàn)在,TOP500已經(jīng)成為衡量超算能力的權威標準。

        而排名第一的計算速度,也以摩爾定律描述的節(jié)奏穩(wěn)步增長,大約每14個月就會翻倍。

        天河一號,是中國第一臺登上榜首 (2010年11月) 的超級計算機,它在榜首呆了六個月時間。

        上月中旬,美國達拉斯舉行的 SC22 會議上,第60期TOP500排行榜結果公布,排名第一的依舊是上次奪魁的Frontier。



        中國的兩臺超算,神威太湖之光和天河2號,分別拿下了排行榜第7和第10位。

        統(tǒng)計所有上榜TOP500的超算,中國共占據(jù)162臺,雖較去年的173臺有所下降,但仍以領先美國36臺的優(yōu)勢,穩(wěn)居世界第一的寶座。

        在算力方面,美國在已部署的算力中以43.2%排名第一,中國以10.6%位列第四。

        Jack Dongarra拿出了一組十分直觀的數(shù)據(jù)。

        現(xiàn)在的計算機,最快每秒是1.1 exaflops,TOP500的最后一名則是1.73 petaflops。

        而Jack Dongarra的筆電是擁有M2處理器的MacBook,它的運行速度是426 gigaflops。

        近30年前,第一代TOP500的榜首,屬于洛斯阿拉莫斯國家實驗室(LANL)用來設計核武器的計算機CM.5,它擁有一千個處理器,運行速度大約是60 gigaflops。

        不用說當年的第一和今日的第一如何如何,今天家用筆電的運行速度,已經(jīng)遠遠超過了30年前的世界最快。

        好了,最后還是說回老爺子。



        年逾七十的他,至今依然活躍在高性能計算領域的一線,今年更是奪得“計算機界的諾貝爾獎”圖靈獎,其中,LINPACK,正是他拿圖靈獎的獲獎工作之一。

        ACM總裁Gabriele Kotsis表示,Jack Dongarra是高性能計算社區(qū)中,最重要且積極參與的領導者之一。

        超算的新benchmark

        也是這位積極的領導者提出,超算需要新的基準測試了!

        背后原因不難理解——

        LINPACK基準測試強調浮點運算,它的核心是矩陣乘法。

        多年以前,團隊設計LINPACK時,浮點運算還是一個很重要的衡量標準。

        今時今日,浮點計算已經(jīng)不那么重要了。

        放眼望去,所有的超算都為浮點計算做了“過量”的準備——Jack Dongarra本人是如此評判的。

        是以,他認為當務之急是需要有新的基準來關心移動數(shù)據(jù),也就是HPCG。



        簡單介紹,HPCG一個共軛梯度算法,它著眼于解決稀疏矩陣問題,而不是密集矩陣。

        這恰恰滿足了今時今日在實際應用中存在的問題。

        相比于舊的基準HPL,HPCG能更好地反映應用程序的效果,但它給出的執(zhí)行速度的數(shù)字會低很多。

        究其背后的原因,是隨著GPU的增強,計算機已經(jīng)可以非常迅速地進行浮點運算,所以HPL得出的數(shù)據(jù),其實是超算潛力被夸大后的結果。

        相對應地,HPCG強調不是浮點數(shù)而是移動數(shù)據(jù),這正是帶寬和延遲會限制超算性能的地方。

        就拿日本超算富岳(Fugaku)來說吧。

        LINPACK基準測試中,富岳排名第一,達到了理論峰值的3%;而運行新基準,富岳只得到了理論峰值的0.8%。

        這意味著計算機并沒有發(fā)揮出它們的潛在性能,需要更仔細地進行研究。



        有趣的一點是,TOP500超算榜上,幾乎97%都在使用x86這種架構,只有5臺超算使用ARM處理器。

        以及,這500臺超算沒有任何一個使用了RISC-V。

        “雖然今天它給高性能計算帶來的影響很小,但也許在未來,我們可以看到RISC-V對它的影響?!盝ack Dongarra說。

        One More Thing

        有些俗套的,在CNCC進行特邀報告演講后,Jack Dongarra被問及“有沒有經(jīng)驗可以介紹給年輕人”。

        他的回答大約可以總結為以下三點:

        追隨激情,做你感興趣的事情。

        把目標定得高一點,同時做好失敗的準備。

        多和別人互動,或許會獲取靈感也說不定吼~


        本文標簽: 程序員  top  圖靈獎  超級計算機  計算機  算法