2023成都積分入學(xué)什么時(shí)候開始申請(qǐng)
2023-01-31
更新時(shí)間:2022-09-30 18:05:45作者:智慧百科
最近,差評(píng)君聽到了一個(gè)好消息。
AI 算力領(lǐng)域的“ 圖靈獎(jiǎng) ”—— MLPerf 測(cè)試,發(fā)布了一個(gè)關(guān)于當(dāng)前主流 ai 芯片的基準(zhǔn)性能的測(cè)試結(jié)果。
一家首次參加測(cè)試的芯片企業(yè)——墨芯人工智能,化身“ 草根英雄 ”,火速制裁了 AI 芯片的霸主英偉達(dá)。
墨芯 S30 芯片在主流 AI 模型之一的圖像分類( ResNet50 )中,以 95784 FPS 的單卡算力奪得全球第一。
是英偉達(dá)現(xiàn)役最強(qiáng) GPU——A100 的 2 倍,是即將上市的英偉達(dá) H100 的 1.2 倍。
對(duì)芯片不太了解的差友,可能不太了解這事的重要性。
市場(chǎng)研究公司 Omdia 調(diào)查顯示:英偉達(dá)占據(jù)了全球人工智能( AI )處理器 80.6% 的市場(chǎng)份額。
而作為他的旗艦產(chǎn)品 A100、H100 幾乎代表了全球同類芯片的最高水平。
如果墨芯 s30 真能超越英偉達(dá)最新科技的話,說(shuō)不定雙方的團(tuán)隊(duì)已經(jīng)在洽談收購(gòu)的事情了。
不過(guò),更逆天的是,墨芯 S30 竟然用 14nm 納米的制程就暴打了 4nm 工藝的英偉達(dá)最強(qiáng) GPU——h100 系列。
這是真的 6 翻了。
雖然,每一年都有一兩家企業(yè)叫囂著:拳打英偉達(dá)、腳踩英特爾。
但是能用 14nm 工藝超越 4nm 工藝的芯片公司,英特爾看了都要饞。
所以要是不出意外的話,憑借這個(gè)技術(shù),名不經(jīng)傳的墨芯公司完全可以,名揚(yáng)大中華,技術(shù)封鎖美利堅(jiān),然后帶著歐盟 27 個(gè)小弟稱霸世界了。
好了,說(shuō)到這里,想必各位差友都知道了
如果不出意外的話,那么意外就來(lái)了。
很快有人扒出來(lái):墨芯這瓜,它不保熟。
雖然,這個(gè)叫做 MLPerf 的性能測(cè)試,權(quán)威且保真。
但是,也有很多周旋的空間。
比如,雖然墨芯公司官方的宣傳里,著重強(qiáng)調(diào)了“ 算力全球第一 ”。
但后續(xù)有人扒出了,這個(gè)“ 全球第一 ”的數(shù)據(jù)經(jīng)過(guò)了“ 美化 ”的處理。
關(guān)鍵性的分組標(biāo)簽,被人p掉了。
原來(lái),這個(gè) MLPerf 測(cè)試它是分為 Closed( 固定任務(wù) )和 Open( 開放優(yōu)化 )兩組。
Closed 代表的固定任務(wù)分組,進(jìn)行的是正式比賽。
也就是說(shuō),廠商們,需要運(yùn)行統(tǒng)一的算法,對(duì)同一個(gè)模型圖像分類( ResNet50 )進(jìn)行計(jì)算,實(shí)現(xiàn)芯片之間的性能比較。
而這個(gè) open 分組就是用來(lái)展示一些創(chuàng)新性的成果的,也就是所謂的表演賽。
在這個(gè)組別里,只要不改變測(cè)試的內(nèi)容,你想怎么玩都行。
而墨芯參加的恰恰就是 open 分區(qū)的測(cè)試。
于是,墨芯 s30 憑借著“ 稀疏化 ”的算法,用“ 無(wú)規(guī)則格斗 ”的打法勝了英偉達(dá)的“ 空手道 ”。
然后,公司再一運(yùn)作,刪刪減減,一個(gè)全球算力第一的營(yíng)銷廣告就這么華麗的出現(xiàn)。
又一個(gè)營(yíng)銷鬼才。
不過(guò)這豈不是證明了墨芯用的稀疏算法,能大幅增加 ai 芯片的算力?
情況也確實(shí)是這樣的。
所謂的稀疏算法,又稱剪枝。
就是在 ai 模型的訓(xùn)練過(guò)程中,把一些不重要的運(yùn)算過(guò)程去掉,大大增加計(jì)算的效率。
這就像識(shí)別一個(gè)超清的圖像,如果我們降低到標(biāo)清的水平,傳輸速度就會(huì)快上許多。
但是,這種成倍提升算力的“ 黑魔法 ”怎么會(huì)沒有代價(jià)呢?
一來(lái), 這種提升算力的方式應(yīng)用場(chǎng)景比較小,不適合高精度的模型訓(xùn)練。
二來(lái),算力是通用的,ai 的模型并不是,這就需要根據(jù)不同的模型,研究不同的稀疏算法。
但問題的重點(diǎn)在于,稀疏算法并不是墨芯一家的專利,英偉達(dá)家的 h100 也能支持。
而且,英偉達(dá)依然是目前唯一一家在每輪 MLPerf 基準(zhǔn)測(cè)試都參與所有主流算法測(cè)試,然后橫掃各項(xiàng)測(cè)試成績(jī)的全能選手。
所以說(shuō),回到 ai 芯片的性能本身,我們還是很難否認(rèn)英偉達(dá)在這方面的統(tǒng)治力。
不過(guò),拋開這次的“ 吊打英偉達(dá) ”的烏龍事件不談,最近幾年國(guó)內(nèi)還是涌現(xiàn)出一批優(yōu)秀的國(guó)產(chǎn) ai 芯片。
比如在今年 3 月,壁仞科技誕生了一枚名為 BR100 的芯片。
這顆芯片 16 位浮點(diǎn)算力在 1000T 以上,8 位定點(diǎn)算力達(dá)到了 2000T 以上,打破了此前一直由國(guó)際巨頭保持的通用 GPU 全球算力紀(jì)錄。
而 19 年,華為發(fā)布的昇騰 910 芯片的算力也號(hào)稱是當(dāng)時(shí)國(guó)際頂尖水平的兩倍。
看來(lái),真金白銀地砸進(jìn)去還是有水花的。
不過(guò),當(dāng)國(guó)內(nèi)芯片的性能開始觸碰到全球算力的天花板的時(shí),我們才發(fā)現(xiàn)差距不止在算力上。
國(guó)內(nèi)的一大批創(chuàng)業(yè)者們,早已經(jīng)在追趕英偉達(dá)的過(guò)程中,撞上了第二堵南墻:生態(tài)。
2016 年前后,ai 的浪潮席卷中國(guó),人人都想做“ 中國(guó)的英偉達(dá) ”。
但后來(lái),國(guó)內(nèi)的廠商們慢慢發(fā)現(xiàn)AI芯片陷入了一個(gè)困境:ai 芯片無(wú)法成為一個(gè)單獨(dú)的產(chǎn)品。
探境科技的CEO概括了這種復(fù)雜的處境:
英偉達(dá)的GPU在AI應(yīng)用中很難被替換,因?yàn)橛ミ_(dá)的GPU除了能處理AI的工作,還能進(jìn)行圖形計(jì)算等。
即便AI專用芯片性能大幅提升,也不能滿足最終應(yīng)用的所有需求,客戶還要再購(gòu)買GPU。
以至于,大家都以兼容英偉達(dá)的軟件開發(fā)系統(tǒng)目標(biāo),如果不兼容,代碼重新開發(fā)或者移植的成本太大了。
之所以會(huì)有這樣的問題,是因?yàn)橛ミ_(dá)依靠在 gpu 上的先發(fā)優(yōu)勢(shì)建立了自己的生態(tài)--CUDA ,一套與英偉達(dá)芯片配套的軟硬件開發(fā)的工具包。
能為幾乎所有主流的 ai 模型服務(wù),同時(shí)大量的開發(fā)者也在反哺和完善這個(gè)生態(tài)。
據(jù) 2021 年英偉達(dá)官方最新數(shù)據(jù)顯示,英偉達(dá)生態(tài)的開發(fā)者數(shù)量已接近 300 萬(wàn), CUDA 在過(guò)去 15 年總計(jì)下載量達(dá) 3000 萬(wàn)次,過(guò)去一年下載量達(dá)到 700 萬(wàn)。
這就好比同樣是一個(gè)野外求生俱樂部。
國(guó)內(nèi)還停留在,拿著一本野外求生指南讓客戶自己學(xué)的階段時(shí)。
而英偉達(dá),已經(jīng)提供了全套裝備。
甚至送來(lái)了一個(gè)貝爺。
這就導(dǎo)致了,AI的軟件生態(tài)成了英偉達(dá)生態(tài)。
而英偉達(dá)的軟件生態(tài),尤其是 CUDA 相關(guān)的核心部分都是閉源、封閉的。
在這樣的封鎖下,想要將自家的軟件與英偉達(dá)的生態(tài)兼容的難度可想而知,建立一個(gè)新的 AI 生態(tài)更是癡人說(shuō)夢(mèng)。
一位國(guó)內(nèi)AI芯片公司軟件的負(fù)責(zé)人直言:“ CEO 和 CTO 都聽不懂我的工作。一些國(guó)內(nèi) AI 公司創(chuàng)始人對(duì)軟件的認(rèn)知,相比領(lǐng)先的國(guó)際大公司,我認(rèn)為有十幾年的差距。”
英偉達(dá) GPU 強(qiáng)大的產(chǎn)品力加上頂尖的 CUDA 軟件生態(tài),使得它在AI領(lǐng)域的勢(shì)力不可動(dòng)搖。
包括微軟、三星、 Snap 等在內(nèi)的 25000 多家企業(yè)客戶,都接入了英偉達(dá)的 ai 推理平臺(tái)。
而且它比想象的要難以超越。
因?yàn)樗粌H比你更強(qiáng),還比你更努力。
在過(guò)去的十年中,英偉達(dá)在研發(fā)方面的支出持續(xù)擴(kuò)大,根據(jù)財(cái)報(bào),2021 年英偉達(dá)研發(fā)投入達(dá)到 39.24 億美元。
所以,在這種全面的領(lǐng)先下,我們很難相信有什么公司可以在ai芯片領(lǐng)域,一步跨越大山一樣的英偉達(dá)。
這一點(diǎn),每年砸出去上百億的英特爾深有體會(huì)。
而相對(duì)于全球其他的競(jìng)爭(zhēng)者們,我們還面臨著芯片制程的問題。
但即便如此,差評(píng)君覺得,差距越大,我們更應(yīng)該腳踏實(shí)地地發(fā)展。
不要幻想一日趕英超美,而是緊緊跟在對(duì)手的身后,就像一頭獵豹,等待敵人犯錯(cuò)。