2023成都積分入學(xué)什么時(shí)候開(kāi)始申請(qǐng)
2023-01-31
更新時(shí)間:2022-09-06 07:05:48作者:佚名
對(duì)于互聯(lián)網(wǎng)公司來(lái)說(shuō),中臺(tái)是一個(gè)非常熟悉的概念。
但在芯片領(lǐng)域,提中臺(tái)概念的人并不多。
2022世界人工智能大會(huì)上,瀚博半導(dǎo)體創(chuàng)始人兼CEO錢軍在談及協(xié)同兩個(gè)產(chǎn)品線時(shí)說(shuō)道:“我們用了中臺(tái)的概念。核心的IP就類似中臺(tái),然后上層有統(tǒng)一的開(kāi)發(fā)平臺(tái)??梢愿鶕?jù)產(chǎn)品和規(guī)劃和側(cè)重點(diǎn),設(shè)計(jì)和推出更符合市場(chǎng)需求的產(chǎn)品?!?/p>
瀚博踐行這一理念的關(guān)鍵是自主研制的統(tǒng)一計(jì)算架構(gòu)(Vastai Unified Compute Architecture)。
所謂的統(tǒng)一計(jì)算架構(gòu),是將多款高性能計(jì)算引擎進(jìn)行整合,擁有高效統(tǒng)一的存儲(chǔ)管理、一致性接口和低鏈接延遲、完整的虛擬化功能、統(tǒng)一的底層軟件設(shè)計(jì)、模塊化的上層計(jì)算算子庫(kù)和功能模塊。
錢軍說(shuō):“瀚博統(tǒng)一架構(gòu)讓計(jì)算密集型的AI、視頻、渲染任務(wù)性能得到最大化硬件加速,同時(shí)端到端縮小延時(shí),一體化助力云端實(shí)時(shí)圖形渲染、AI增強(qiáng)處理、視頻編解碼等需求。這個(gè)架構(gòu)包含硬件架構(gòu)和軟件架構(gòu)。”
與瀚博統(tǒng)一計(jì)算架構(gòu)同時(shí)推出的是瀚博的軟件平臺(tái)VastStream,有統(tǒng)一接口、靈活調(diào)度、通用AI計(jì)算、多路高效視頻轉(zhuǎn)碼+AI增強(qiáng)、易編程快遷移、工具鏈完備等,可加速各類AI應(yīng)用部署,包括計(jì)算機(jī)視覺(jué)、視頻處理、自然語(yǔ)言處理、搜索與推薦、算子自定義擴(kuò)展等。
基于這樣的理念和軟硬件統(tǒng)一架構(gòu),更容易理解瀚豐富的產(chǎn)品線,以及統(tǒng)一架構(gòu)的價(jià)值。
基于統(tǒng)一計(jì)算架構(gòu)的AI和GPU芯片
去年,瀚博半導(dǎo)體發(fā)布了其首款云端AI推理芯片SV102及搭載此芯片的載天系列通用加速卡VA1。
“我們的第一個(gè)產(chǎn)品選擇了AI+視頻領(lǐng)域,這是我們的突破口。”錢軍透露,“在第一款芯片SV102中,就有一個(gè)性能不錯(cuò)的圖形渲染模塊,只是我們沒(méi)有對(duì)外宣傳。兩款產(chǎn)品都基于瀚博的統(tǒng)一計(jì)算架構(gòu)中?!?/p>
可以將瀚博的統(tǒng)一計(jì)算架構(gòu)理解為一個(gè)構(gòu)建好的房屋整體框架,框架確定了不同的功能區(qū)域,也就是對(duì)應(yīng)不同的加速核。根據(jù)需求,房屋建設(shè)的時(shí)候可以在架構(gòu)不變的前提下可以調(diào)整功能區(qū)并裝修成不同風(fēng)格,對(duì)應(yīng)到芯片上,也就是不同性能、功能有所差異的芯片。
這樣做最大的優(yōu)勢(shì)是可以復(fù)用很多資源,以最少的投入滿足更多的需求,其實(shí)也就是互聯(lián)網(wǎng)公司所提的中臺(tái)的優(yōu)勢(shì)。
體現(xiàn)到產(chǎn)品中,基于統(tǒng)一的計(jì)算架構(gòu),瀚博既能開(kāi)發(fā)出高性能云端推理芯片以及邊緣的AI芯片,也能推出GPU。
2022世界人工智能大會(huì)期間,瀚博不僅發(fā)布了數(shù)據(jù)中心推理卡載天VA10,以及首款面向邊緣大算力場(chǎng)景推理卡載天VE1系列,還展示了即將發(fā)布的7你們?cè)贫薌PU芯片SG100。
載天V10是VA1的后續(xù)產(chǎn)品,最大的亮點(diǎn)是Int8峰值算力達(dá)400TOPS,刷新業(yè)界紀(jì)錄,適用于直播視頻增強(qiáng)、智慧交通管理、實(shí)時(shí)語(yǔ)義理解等場(chǎng)景。
瀚博給出的數(shù)據(jù)顯示,載天VA10的功耗為150瓦,整體最高推理性能達(dá)到同功耗主流GPU的2倍以上,且延時(shí)低至后者的6%。在低延時(shí)場(chǎng)景(低于4毫秒的YoloV3檢測(cè)算法場(chǎng)景)下,載天VA10推理性能達(dá)到同功耗市場(chǎng)主流GPU的3倍以上。
“瀚博75瓦的加速卡就可以替代150瓦的卡,之所以我們還是150瓦的卡,主要是考慮到服務(wù)器有不同結(jié)構(gòu),有的結(jié)構(gòu)不一定能插入16+75瓦的卡,150瓦的加速卡適用性更廣。”錢軍表示。
載天VE1系列是瀚博首款面向邊緣大算力的推理卡,具有超低時(shí)延與超高吞吐率、低功耗、大算力的特性。在40-65瓦功耗下,INT8峰值算力達(dá)100 TOPS,支持60路1080P視頻實(shí)時(shí)解碼,支持主流AI框架的模型,提供從模型編譯到推理優(yōu)化的全流程低代碼開(kāi)發(fā)框架VastPipe,提供端到端的軟硬件AI推理解決方案。
另?yè)?jù)瀚博的測(cè)試數(shù)據(jù),載天VE1吞吐率達(dá)到主流GPU的2倍,時(shí)延僅為其的1/5。
“載天VE1可以在非常適用于智慧交通、車路協(xié)同、工業(yè)質(zhì)檢等邊緣打算力場(chǎng)景,充分發(fā)揮超高吞吐率和超低時(shí)延的優(yōu)勢(shì)。”錢軍表示。
AI芯片之外,瀚博新產(chǎn)品的一大亮點(diǎn)就是7nm云端GPU——瀚博SG100。
錢軍稱SG100 GPU擁有世界領(lǐng)先的超高吞吐、超高質(zhì)量、低延時(shí)的編碼能力,集渲染、AI、視頻于一體,還提供世界一流的SR-IOV虛擬化支持。
雷峰網(wǎng)了解到,SG100會(huì)在不久的將在正式發(fā)布和量產(chǎn)。
對(duì)于推出GPU,錢軍表示這一直在其公司的計(jì)劃中,也相信元宇宙的發(fā)展回對(duì)圖形渲染有爆炸式的需求增長(zhǎng),瀚博的GPU看好的是這一市場(chǎng)需求。
當(dāng)然,瀚博能設(shè)計(jì)出GPU還有團(tuán)隊(duì)的關(guān)鍵因素。錢軍在創(chuàng)業(yè)前是AMD 高管,曾帶領(lǐng)AMD中國(guó)團(tuán)隊(duì)設(shè)計(jì)量產(chǎn)了業(yè)界第一顆7納米圖形處理器和第一顆7納米GPGPU架構(gòu)的AI芯片。瀚博和核心研發(fā)團(tuán)隊(duì)也都擁有18年以上高端芯片設(shè)計(jì)和量產(chǎn)的經(jīng)驗(yàn)。
統(tǒng)一計(jì)算架構(gòu)對(duì)產(chǎn)品落地的價(jià)值
對(duì)于一家初創(chuàng)公司來(lái)說(shuō),同時(shí)布局云端推理、邊緣高性能推理以及GPU三條產(chǎn)品線需要大量的資金投入,是一個(gè)巨大的挑戰(zhàn)。以中臺(tái)的理念,用統(tǒng)一計(jì)算架構(gòu)的方式,能夠在很大程度上提升研發(fā)的效率,降低投入。
實(shí)際上芯片巨頭也在采用這樣的路線,比如高通就提出了統(tǒng)一的技術(shù)路線圖。
中臺(tái)理念,或者說(shuō)統(tǒng)一計(jì)算架構(gòu)在實(shí)際執(zhí)行中面臨著諸多挑戰(zhàn),要在一個(gè)統(tǒng)一的計(jì)算架構(gòu)下,涵蓋多款不同特性的產(chǎn)品,非常考驗(yàn)架構(gòu)設(shè)計(jì)者的能力,必須要有長(zhǎng)遠(yuǎn)的考慮,有架構(gòu)思維,保證架構(gòu)有足夠的靈活性,同時(shí)要兼顧效率等要求。
軟件層面,由于要直接面對(duì)最終用戶,在各種不同的需求下,要兼顧易用性和靈活性,同時(shí)還需要面對(duì)效率的挑戰(zhàn),并且還要在統(tǒng)一架構(gòu)的框架下,保證產(chǎn)品的延續(xù)性。
這就意味著,統(tǒng)一的架構(gòu)能帶來(lái)效率的提升,但也考驗(yàn)著底層架構(gòu)設(shè)計(jì)者的經(jīng)驗(yàn)和能力,以及最終產(chǎn)品實(shí)現(xiàn)時(shí)的堅(jiān)定決心。當(dāng)然,統(tǒng)一架構(gòu)的優(yōu)勢(shì)也十分明顯,在構(gòu)建生態(tài)以及產(chǎn)品落地時(shí),能夠集中力量,更快發(fā)展。
2022年,瀚博先后與福建大數(shù)據(jù)集團(tuán)、國(guó)寧瑞能,高新興、超聚變等企業(yè),在智慧城市、智慧政務(wù)、智慧交通、智慧園區(qū)、智慧能源等場(chǎng)景開(kāi)展了深入合作。
接下來(lái),隨著邊緣大算力AI產(chǎn)品的推出和落地,加上即將發(fā)布的GPU,我們將能夠看到瀚博的統(tǒng)一架構(gòu)戰(zhàn)略的成敗。