中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

    <sub id="dxmnt"><ol id="dxmnt"></ol></sub>

      1. 英偉達(dá)「一句話生成3D模型」碾壓谷歌:分辨率清晰8倍,速度快2倍

        更新時(shí)間:2022-11-22 14:06:50作者:智慧百科

        英偉達(dá)「一句話生成3D模型」碾壓谷歌:分辨率清晰8倍,速度快2倍

        豐色 發(fā)自 凹非寺
        量子位 | 公眾號(hào) QbitAI

        一句話生成3D模型,英偉達(dá)也來(lái)“秀肌肉”了~

        來(lái)看它最新?lián)v鼓出的Magic3D AI,效果是這樣兒的。

        輸入“坐在睡蓮上的藍(lán)色箭毒蛙”,就能得到這樣一個(gè)細(xì)節(jié)豐富的3D模型:


        “擺滿了水果的銀盤”也難不倒它:


        還有諸如“鳥瞰角度的城堡”、“用壽司做的汽車”、“裝著蛋的鳥巢”、“用垃圾袋做的裙子”……


        精準(zhǔn)程度可見一斑。

        除了這個(gè)主要本領(lǐng),它還可以通過(guò)編輯文本完成模型的修改:


        或者在輸入中攜帶一些圖片,最終成果就可以保留圖中的風(fēng)格或者主要“人物”。



        不知道這把有沒(méi)有打到你的心巴上?

        反正建模師看了都要喊失業(yè)了……



        如何做到?

        據(jù)介紹,Magic3D快速、高質(zhì)量地得到結(jié)果所采用的策略是“從粗到細(xì)”,一共經(jīng)過(guò)兩階段:

        低分辨率優(yōu)化和高分辨率優(yōu)化。


        它使用eDiff-l作為模型的低分辨率文本到圖像擴(kuò)散先驗(yàn)(diffusion prior)。

        首先,第一階段,采用英偉達(dá)今年推出的3D重建模型Instant NGP,并對(duì)其優(yōu)化,生成初始3D模型。

        具體來(lái)說(shuō),就是通過(guò)重復(fù)采樣和渲染低分辨率圖像,計(jì)算出SDS損失,讓Instant NGP給出結(jié)果。

        注:SDS全稱得分蒸餾采樣(Score Distillation Sampling),是谷歌提出的一種新的采樣方法,它無(wú)需對(duì)擴(kuò)散模型進(jìn)行反向傳播更新。

        這步完成后,就使用DMTet提取出初始3D mesh,作為第二階段的輸入。

        第二階段采用高分辨率文本到圖像潛(latent)擴(kuò)散先驗(yàn)。

        還是使用同樣的方法,對(duì)高分辨率圖像進(jìn)行采樣和渲染,并使用相同的步驟進(jìn)行更新,得到最終結(jié)果。

        唯一的不同,就是本階段的操作都是在第一階段得出的初始“糙”模型上進(jìn)行的。

        比DreamFusion分辨率高8倍,速度快2倍

        關(guān)注這一領(lǐng)域的朋友知道,一句話生成3D模型的AI中,目前最受關(guān)注的當(dāng)屬谷歌今年9月剛發(fā)布的DreamFusion。


        它通過(guò)一個(gè)預(yù)先訓(xùn)練的二維文本到圖像擴(kuò)散模型來(lái)完成最終的文本到三維合成,效果驚艷。

        那么,英偉達(dá)剛推出的這個(gè)Magic3D,與之相比如何?

        經(jīng)實(shí)驗(yàn)對(duì)比發(fā)現(xiàn),后來(lái)者顯然更勝一籌,主要表現(xiàn)在分辨率和速度上:

        Magic3D的分辨率比DreamFusion高8倍,速度快2倍——只需在40分鐘之內(nèi)即可完成一次渲染。

        而在具體效果上,Magic3D的生成結(jié)果也更細(xì)節(jié)一些,比如下面的“仙人掌”、“房子”和“草莓”等(左為Magic3D,右為DreamFusion)。



        不過(guò),遺憾的是,Magic3D還并未像DreamFusion一樣已開源。

        關(guān)于作者

        一共有10位。


        前5位都具有同等貢獻(xiàn),包括:

        現(xiàn)英偉達(dá)研究科學(xué)家、博士畢業(yè)于CMU機(jī)器人專業(yè)的Lin Chen-Hsuan,他曾在Facebook人工智能研究部和Adobe實(shí)習(xí);

        正在多倫多大學(xué)讀博士的Gao Jun,北大計(jì)算機(jī)本科畢業(yè);

        正在多倫多讀博士的Zeng Xiaohui,香港科技大學(xué)畢業(yè);

        以及同樣來(lái)自該大學(xué)的Towaki Takikawa;

        最后是正在康奈爾大學(xué)讀博士的唐路明,清華大學(xué)物理和數(shù)學(xué)專業(yè)本科畢業(yè)。

        論文地址:
        https://arxiv.org/abs/2211.10440

        項(xiàng)目主頁(yè):
        https://deepimagination.cc/Magic3D/

        參考鏈接:
        https://twitter.com/_akhaliq/status/1594505474774278147?s=46&t=Dc0f1ExmRsdk_PHz2JX-IA

        本文標(biāo)簽: 英偉達(dá)  谷歌