2023成都積分入學(xué)什么時候開始申請
2023-01-31
更新時間:2022-10-01 16:35:23作者:智慧百科
DPU自2020年爆火至今已有2年,從目前行業(yè)的關(guān)注度來看,DPU帶來的機(jī)遇已經(jīng)基本形成共識。世界范圍來看,DPU競爭激烈,國外大廠英偉達(dá)、AMD、英特爾、高通、博通一線廠商均開始在DPU方向發(fā)力,DPU已經(jīng)成為很重要的一個賽道。最好的時代就在當(dāng)下。
DPU火熱兩年,我們對其又有了新認(rèn)識
首先讓我們再來看看,DPU為何會在2020年左右火起來呢?此前的解釋:摩爾定律的放緩與全球數(shù)據(jù)量的爆發(fā)這個正在迅速激化的矛盾通常被作為處理器專用化的大背景,但是該大背景雖然有一定的合理性,但是還是過于模糊,并沒有更好的解釋出DPU“橫空出世”的原因。中科馭數(shù)發(fā)布的《專?數(shù)據(jù)處理器 (DPU)技術(shù)白皮書》中對這一原因做了另外的解釋:通過比較網(wǎng)絡(luò)帶寬的增長趨勢和通用CPU性能增長趨勢,能發(fā)現(xiàn)一個有趣的現(xiàn)象:帶寬性能增速比(RBP,Ratio of Bandwidth and Performance growth rate)失調(diào)。
2010年前,網(wǎng)絡(luò)的帶寬年化增長大約是30%,到2015年微增到35%,然后在近年達(dá)到45%。相對應(yīng)的,CPU的性能增長從10年前的23%,下降到12%,并在近年直接降低到3%。在這三個時間段內(nèi),RBP指標(biāo)從1附近,上升到3,并在近年超過了10!如果在網(wǎng)絡(luò)帶寬增速與CPU性能增速近乎持平,RGR~1,IO壓力尚未顯現(xiàn)出來,那么當(dāng)目前RBP達(dá)到10倍的情形下,CPU幾乎已經(jīng)無法直接應(yīng)對網(wǎng)絡(luò)帶寬的增速。因此,帶寬性能增速比的失調(diào)激化了對DPU的需求。
那么什么是DPU?關(guān)于DPU的定義很多,DPU是以數(shù)據(jù)為中心構(gòu)造的專用處理器,采用軟件定義技術(shù)路線支撐基礎(chǔ)設(shè)施層資源虛擬化、存儲、安全、服務(wù)質(zhì)量管理等服務(wù)。DPU是下一代“算力網(wǎng)絡(luò)”的核心支撐組件。
其實DPU是什么不重要,重要的是DPU能做什么。如果從功能角度來看DPU,英偉達(dá)認(rèn)為DPU的功能是,用來把數(shù)據(jù)在正確的時間放到正確的位置。什么叫正確的時間放到正確的位置?正確的時間指的是必須延遲要滿足要求,帶寬要能達(dá)到數(shù)據(jù)量,自己的數(shù)據(jù)帶寬要做到匹配;正確的位置指的是要把所有的遠(yuǎn)程資源都本地化,所有的跨節(jié)點(diǎn)訪問都要做的跟訪問本地的資源是一樣的。
那么,DPU的市場價值是怎樣的呢?很多人會認(rèn)為DPU是一顆專用芯片,一旦專用化,就代表你需要很多定制化,定制化以后就會非標(biāo),一旦非標(biāo)價值就很低,其實這是一個認(rèn)知的誤區(qū)。定制化、專用化、標(biāo)準(zhǔn)化這三者是完全不相關(guān)的概念:專用化強(qiáng)調(diào)的是應(yīng)用場景,跟最后的價值高低沒有直接關(guān)系;定制化是技術(shù)實現(xiàn)的路徑選擇;標(biāo)準(zhǔn)化是為了降低邊際成本。那么DPU是否能標(biāo)準(zhǔn)化?中科馭數(shù)創(chuàng)始人兼CEO鄢貴海表示,我們覺得,DPU肯定是個好東西,標(biāo)準(zhǔn)化也能做成,但是有挑戰(zhàn)。
DPU特有的挑戰(zhàn),要求芯片廠商必須軟硬兼施
任何一個新技術(shù)在做產(chǎn)業(yè)化的過程中,都會面臨一些特定的挑戰(zhàn),DPU也不例外,而且其面臨的挑戰(zhàn)還不小。
DPU很大的一個應(yīng)用挑戰(zhàn)就是跨平臺下的“適配”問題,DPU要與當(dāng)下的CPU以及各種操作系統(tǒng)進(jìn)行適配,這非??简濪PU廠商的技術(shù)實力。而且加之DPU本身特有的挑戰(zhàn)主要有需求比較碎片化、軟件生態(tài)不夠成熟。當(dāng)然DPU還有一些行業(yè)共性的挑戰(zhàn),比如芯片量產(chǎn)供應(yīng)鏈的問題和高水平研發(fā)人員的短缺問題。
所以DPU必是一個軟硬兼施的產(chǎn)業(yè),“如果不做軟件,DPU整個功能和性能都沒法得到充分的釋放,這就導(dǎo)致最后你要去兼容各種奇形怪狀上層的系統(tǒng),那些系統(tǒng)比應(yīng)用還碎片化?!臂迟F海指出。
正因為如此,我們可以看到,英偉達(dá)為其BlueField DPU特意打造了DOCA軟件框架,DOCA能將BlueField DPU提供的硬件能力做軟件抽象和封裝,以SDK Library的形式提供友好的可編程接口,提高應(yīng)用開發(fā)的效率。
中科馭數(shù)從2018年就提出了“軟件定義加速器“的發(fā)展路徑,四年磨一劍,中科馭數(shù)自研的HADOS系統(tǒng)已經(jīng)迭代到第三代,直接對標(biāo)英偉達(dá)的DOCA。在中科馭數(shù)看來,HADOS是解決DPU眾多挑戰(zhàn)的最重要的一招棋。下圖展示了DOCA、OneAPI和HADOS的比較。得益于中科馭數(shù)自研的軟件開發(fā)平臺HADOS,馭數(shù)產(chǎn)品靈活度高、穩(wěn)定性強(qiáng)、兼容性好,全面適配國內(nèi)外多種操作系統(tǒng),大幅降低應(yīng)用軟件開發(fā)難度。
DOCA、OneAPI與HADOS比較分析(需要指明的是,OneAPI本身并不提供DPU設(shè)備,而是構(gòu)建一個軟件框架來整合業(yè)界現(xiàn)有的異構(gòu)計算設(shè)備)(來源:2021《專用數(shù)據(jù)處理器(DPU)技術(shù)白皮書》)
第一批國內(nèi)做DPU的廠商發(fā)展到哪一步了?
芯片算力的發(fā)展有三個要素:第一,性能必須要高;第二是生產(chǎn)率,主要看系統(tǒng)能不能做的更好用,學(xué)習(xí)成本更低,以及兼容性做到最廣;第三是成本能不能盡量做到優(yōu)勢。
對一個初創(chuàng)公司來說,大抵都是從第一點(diǎn)開始做起,循序漸進(jìn)。那第一批國內(nèi)創(chuàng)業(yè)做DPU的廠商發(fā)展到哪一步了?拿中科馭數(shù)來說,目前大致處在第二階段,不管是DPU的核心架構(gòu)還是軟件的頻繁迭代,以及跟國產(chǎn)品牌適配等等,這些都是為了解決DPU產(chǎn)品能好用、易用的問題。
接下來就是解決第三個成本的問題,今天單顆DPU成本還比較高,主要原因是:大規(guī)模化還沒起來,AMD認(rèn)為10萬顆以上才算上量,就服務(wù)端的CPU來看,確實還是一個比較不錯的量。那么DPU能達(dá)到怎樣的體量呢?鄢貴海表示:“DPU最后的量不會低于服務(wù)器的量,這就意味著我們還有很大的空間去通過規(guī)模效應(yīng)降低我們產(chǎn)品的成本。這也是馭數(shù)從現(xiàn)階段基本形成商業(yè)閉環(huán),到發(fā)展成為產(chǎn)業(yè)比較重要位置的公司,要突破的最后一道屏障。”
中科馭數(shù)的DPU也是按照算力發(fā)展的三大要素這樣的路徑演化:其K1主要用于交易風(fēng)控;K2開始進(jìn)入了數(shù)據(jù)中心的一些場景,而且K2在功能和性能上都有了較大的提升,第二代DPU芯片K2預(yù)計近期回片,這也是國內(nèi)目前功能定義相對較完整的首顆DPU芯片;到明年,K2的增強(qiáng)版主頻提高到800MHz,功耗優(yōu)化60%,面積優(yōu)化75%等等,并進(jìn)一步拓寬DPU的應(yīng)用領(lǐng)域,完善DPU功能設(shè)置;K3設(shè)計方案已經(jīng)完成,今年第四季度將啟動研發(fā)K3有望對標(biāo)甚至超越BF3、MtEvans。可以看出,中科馭數(shù)作為國內(nèi)第一批研究DPU芯片的企業(yè),其芯片迭代的節(jié)奏正在有條不紊的進(jìn)行中。
值得一提的是,中科馭數(shù)在落地場景的選擇上,首先瞄準(zhǔn)的是超低時延的金融場景。在金融場景,對于DPU來說,超低延遲網(wǎng)卡是剛需,必須要做到1.7μs才是超低時延。而在這個場景下,處于長期被國外廠商壟斷的局面,直到去年,AMD占據(jù)90%以上的市場份額,剩下的幾乎被英偉達(dá)占據(jù),還有思科。中科馭數(shù)做了4年,才在這個場景躋身為行業(yè)第四個玩家,打破了國際廠商的壟斷。接下來,中科馭數(shù)將發(fā)力更廣闊的數(shù)據(jù)中心和5G邊緣計算等云原生場景,預(yù)計到2022年底,中科馭數(shù)將成為國內(nèi)DPU行業(yè)在云原生應(yīng)用上首個大訂單。
所以接下來的重頭戲?qū)⑹荎2芯片。據(jù)中科馭數(shù)CTO盧文巖博士的總結(jié),中科馭數(shù)的K2-DPU主要有五大優(yōu)勢:
1)技術(shù)先進(jìn):通過架構(gòu)創(chuàng)新,首創(chuàng)KPU芯片架構(gòu),可集成數(shù)百異構(gòu)處理器核;
2)功能完備:K2從指標(biāo)和功能覆蓋面來看,相比一線廠商相比是不弱的,K2-DPU可以覆蓋虛擬化、網(wǎng)絡(luò)、計算、存儲、安全等全功能;
3)性能高:具體到各功能來看,其中在DPU中很關(guān)鍵的一個功能網(wǎng)絡(luò)處理的引擎方面,中科馭數(shù)的K2可以直接對標(biāo)業(yè)界領(lǐng)先的AMD方案,達(dá)到400Gbps,轉(zhuǎn)發(fā)延遲小于5μs;再者,被認(rèn)為是下一代數(shù)據(jù)中心互聯(lián)核心的RDMA協(xié)議,目前能商用的RDMA的引擎只有英偉達(dá),但是現(xiàn)在中科馭數(shù)RDMA引擎已經(jīng)做到在鏈接數(shù)和延時等多方面功能和性能直接對標(biāo)英偉達(dá)。此外,K2無論是性能還是時延方面遠(yuǎn)超F(xiàn)PGA智能網(wǎng)卡方案,
4)成熟度高:已達(dá)到量產(chǎn)標(biāo)準(zhǔn),2023年全面量產(chǎn);
5)生態(tài)完善:HADOS軟件已經(jīng)批量部署。
日前,中科馭數(shù)宣布完成超以往輪次融資規(guī)模的數(shù)億元B輪融資,本輪融資將進(jìn)一步加速馭數(shù)DPU芯片的研發(fā)迭代和產(chǎn)業(yè)布局,加速構(gòu)建DPU芯片的生態(tài)體系,為數(shù)據(jù)中心下一代算力架構(gòu)變革,提供純國產(chǎn)核心級基礎(chǔ)設(shè)施,繼續(xù)保持DPU賽道的領(lǐng)跑地位。
對于DPU乃至整個半導(dǎo)體產(chǎn)業(yè)而言,當(dāng)下我們正處于百年未有之大變局。新基建、東數(shù)西算以及運(yùn)營商的算力網(wǎng)絡(luò)規(guī)劃等給國產(chǎn)DPU行業(yè)帶來了重要的機(jī)遇。在這樣的背景下,國產(chǎn)DPU廠商應(yīng)當(dāng)利用好國產(chǎn)信創(chuàng)行業(yè)的發(fā)展機(jī)遇,扎實推進(jìn)核心功能的自主研發(fā),把產(chǎn)品做好;走開放的系統(tǒng),與CPU、OS、網(wǎng)絡(luò)等廠商,相互融合,共創(chuàng)繁榮。同時,構(gòu)筑與國內(nèi)其他類型DPU研發(fā)團(tuán)隊寫作共贏的機(jī)制,早日將DPU發(fā)展成為行業(yè)新的生產(chǎn)力。