中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

<sub id="dxmnt"><ol id="dxmnt"></ol></sub>

<td id="wejdg"><ol id="wejdg"></ol></td>

<thead id="wejdg"><ol id="wejdg"></ol></thead>

<small id="wejdg"><kbd id="wejdg"></kbd></small>

<tfoot id="wejdg"><kbd id="wejdg"><acronym id="wejdg"></acronym></kbd></tfoot>

<p id="wejdg"><kbd id="wejdg"></kbd></p>

網(wǎng)站首頁

收藏本站

首頁 > 熱點(diǎn)資訊

一顆GPU，秒出3D模型！OpenAI重磅新作：Point-E用文本即可生成三維點(diǎn)云模型

更新時間：2022-12-21 16:05:47作者：智慧百科

一顆GPU，秒出3D模型！OpenAI重磅新作：Point-E用文本即可生成三維點(diǎn)云模型

新智元報道

編輯：Joey Aeneas

【新智元導(dǎo)讀】文本除了生成圖像、視頻，還有3D模型！OpenAI最新發(fā)布的POINT-E，輸入Prompt一分鐘內(nèi)便可生成3D模型。

席卷AI世界的下一個突破在哪里？

很多人預(yù)測，是3D模型生成器。

繼年初推出的DALL-E 2用天才畫筆驚艷所有人之后，周二OpenAI發(fā)布了最新的圖像生成模型「POINT-E」，它可通過文本直接生成3D模型。

論文鏈接：https://arxiv.org/pdf/2212.08751.pdf

相比競爭對手們（如谷歌的DreamFusion）需要幾個GPU工作數(shù)個小時，POINT-E只需單個GPU便可在幾分鐘內(nèi)生成3D圖像。

經(jīng)小編實(shí)戰(zhàn)測試，Prompt輸入后POINT-E基本可以秒出3D圖像，此外輸出圖像還支持自定義編輯、保存等功能。

地址：https://huggingface.co/spaces/openai/point-e

網(wǎng)友也開始嘗試不同的prompt輸入。

但輸出的結(jié)果并不都令人滿意。

還有網(wǎng)友表示，POINT-E或許可以實(shí)現(xiàn)Meta的元宇宙愿景？

需要注意的是，POINT-E是通過點(diǎn)云（point cloud），也就是空間中點(diǎn)的數(shù)據(jù)集來生成3D圖像。

簡單來說，就是通過三維模型進(jìn)行數(shù)據(jù)采集獲取空間中代表3D形狀的點(diǎn)云數(shù)據(jù)。

從計算的角度來看，點(diǎn)云更容易合成，但它們無法捕獲對象的細(xì)膩形狀或紋理，這是目前Point-E的一個短板。

為解決這個限制，Point-E團(tuán)隊訓(xùn)練了一個額外的人工智能系統(tǒng)來將Point-E 的點(diǎn)云轉(zhuǎn)換為網(wǎng)格。

將Point-E點(diǎn)云轉(zhuǎn)換為網(wǎng)格

在獨(dú)立的網(wǎng)格生成模型之外，Point-E 由兩個模型組成：

一個文本圖像轉(zhuǎn)化模型（text-to-image model）和圖像轉(zhuǎn)化3D模型（image-to-3D model）。

文本圖像轉(zhuǎn)化模型類似于OpenAI的DALL-E 2和Stable Diffusion，在標(biāo)記圖像上進(jìn)行訓(xùn)練以理解單詞和視覺概念間的關(guān)聯(lián)。

然后，將一組與3D對象配對圖像輸入3D轉(zhuǎn)化模型，以便模型學(xué)會在兩者之間有效轉(zhuǎn)換。

當(dāng)輸入一個prompt時，文本圖像轉(zhuǎn)化模型會生成一個合成渲染對象，該對象被饋送到圖像轉(zhuǎn)化3D模型，然后生成點(diǎn)云。

OpenAI研究人員表示，Point-E經(jīng)歷了數(shù)百萬3D對象和相關(guān)元數(shù)據(jù)的數(shù)據(jù)集的訓(xùn)練。

但它并不完美，Point-E 的圖像到 3D 模型有時無法理解文本到圖像模型中的圖像，導(dǎo)致形狀與文本提示不匹配。盡管如此，它仍然比以前的最先進(jìn)技術(shù)快幾個數(shù)量級。

他們在論文中寫道：

雖然我們的方法在評估中的表現(xiàn)比最先進(jìn)的技術(shù)差，但它只用了一小部分時間就可以生成樣本。這可以使它對某些應(yīng)用程序更實(shí)用，并且發(fā)現(xiàn)更高質(zhì)量的3D對象。

Point-E架構(gòu)與運(yùn)行機(jī)制

Point-E模型首先使用文本到圖像的擴(kuò)散模型生成一個單一的合成視圖，然后使用第二個擴(kuò)散模型生成一個三維點(diǎn)云，該模型以生成的圖像為條件。

雖然該方法在采樣質(zhì)量方面仍未達(dá)到最先進(jìn)的水平，但它的采樣速度要快一到兩個數(shù)量級，為一些使用情況提供了實(shí)際的權(quán)衡。

下圖是該模型的一個high-level的pipeline示意圖：

我們不是訓(xùn)練單個生成模型，直接生成以文本為條件的點(diǎn)云，而是將生成過程分為三個步驟。

首先，生成一個以文本標(biāo)題為條件的綜合視圖。

接下來，生成?個基于合成視圖的粗略點(diǎn)云（1,024 個點(diǎn)）。

最后，生成了?個以低分辨率點(diǎn)云和合成視圖為條件的精細(xì)點(diǎn)云（4,096 個點(diǎn)）。

在數(shù)百萬個3D模型上訓(xùn)練模型后，我們發(fā)現(xiàn)數(shù)據(jù)集的數(shù)據(jù)格式和質(zhì)量差異很大，這促使我們開發(fā)各種后處理步驟，以確保更高的數(shù)據(jù)質(zhì)量。

為了將所有的數(shù)據(jù)轉(zhuǎn)換為?種通用格式，我們使用Blender從20個隨機(jī)攝像機(jī)角度，將每個3D模型渲染為RGBAD圖像（Blender支持多種3D格式，并帶有優(yōu)化的渲染引擎）。

對于每個模型，Blender腳本都將模型標(biāo)準(zhǔn)化為邊界立方體，配置標(biāo)準(zhǔn)照明設(shè)置，最后使用Blender的內(nèi)置實(shí)時渲染引擎，導(dǎo)出RGBAD圖像。

然后，使用渲染將每個對象轉(zhuǎn)換為彩色點(diǎn)云。首先，通過計算每個RGBAD圖像中每個像素的點(diǎn)，來為每個對象構(gòu)建?個密集點(diǎn)云。這些點(diǎn)云通常包含數(shù)十萬個不均勻分布的點(diǎn)，因此我們還使用最遠(yuǎn)點(diǎn)采樣，來創(chuàng)建均勻的4K點(diǎn)云。

通過直接從渲染構(gòu)建點(diǎn)云，我們能夠避免直接從3D網(wǎng)格中采樣可能出現(xiàn)的各種問題，對模型中包含的點(diǎn)進(jìn)行取樣，或處理以不尋常的文件格式存儲的三維模型。

最后，我們采用各種啟發(fā)式方法，來減少數(shù)據(jù)集中低質(zhì)量模型的頻率。

首先，我們通過計算每個點(diǎn)云的SVD來消除平面對象，只保留那些最小奇異值高于某個閾值的對象。

接下來，我們通過CLIP特征對數(shù)據(jù)集進(jìn)行聚類（對于每個對象，我們對所有渲染的特征進(jìn)行平均）。

我們發(fā)現(xiàn)，一些集群包含許多低質(zhì)量的模型類別，而其他集群則顯得更加多樣化或可解釋。

我們將這些集群分到幾個不同質(zhì)量的bucket中，并使用所得bucket的加權(quán)混合作為我們的最終數(shù)據(jù)集。

應(yīng)用前景

OpenAI 研究人員指出，Point-E的點(diǎn)云還可用于制造真實(shí)世界的物體，比如3D打印。

通過額外的網(wǎng)格轉(zhuǎn)換模型，該系統(tǒng)還可以進(jìn)入游戲和動畫開發(fā)工作流程。

雖然目前的目光都集中在2D藝術(shù)生成器上，但模型合成人工智能可能是下一個重大的行業(yè)顛覆者。

3D模型廣泛應(yīng)用于影視、室內(nèi)設(shè)計、建筑和各種科學(xué)領(lǐng)域。

當(dāng)下3D模型的制造耗時通常需要幾個小時，而Point-E的出現(xiàn)恰恰彌補(bǔ)了這一缺點(diǎn)。

研究人員表示現(xiàn)階段Point-E還存在許多缺陷，如從訓(xùn)練數(shù)據(jù)中繼承的偏差以及對于可能用于創(chuàng)建危險物體的模型缺乏保護(hù)措施。

Point-E只是個起點(diǎn)，他們希望它能激發(fā)文本到3D合成領(lǐng)域的「進(jìn)一步工作」。

參考資料：

https://techcrunch.com/2022/12/20/openai-releases-point-e-an-ai-that-generates-3d-models/?tpcc=tcplustwitter

https://www.engadget.com/openai-releases-point-e-dall-e-3d-text-modeling-210007892.html?src=rss

本文標(biāo)簽： openai 點(diǎn)云視圖

上一篇：蓋茨批馬斯克管理推特方式：＂拍腦袋＂做決定太瘋狂

下一篇：雷軍賭上一切的戰(zhàn)爭｜年度25人系列

相關(guān)文章

為您推薦

2023成都春季開學(xué)要考試嗎

2023年春季開學(xué)后，各學(xué)校可結(jié)合實(shí)際對學(xué)生學(xué)習(xí)情況進(jìn)行診斷分析，具體以學(xué)校要求為準(zhǔn)。

2023-01-31 12:49

成都積分入學(xué)可以不是本人辦理嗎

成都積分入學(xué)是成都隨遷子女入學(xué)申請的方式之一，關(guān)于積分入學(xué)申請條件和要求，小編為您整理如下：

2023-01-31 12:49

2023成都積分入學(xué)什么時候開始申請

成都隨遷子女入學(xué)申請須于子女入學(xué)當(dāng)年2月1日至4月30日申報積分并辦結(jié)，詳見下文：

2023-01-31 12:49

注意！2023年退役軍人高考加分政策新發(fā)布

2023年退役軍人高考加分政策發(fā)布

2023-01-31 12:30

廣東人有多愛“刮刮樂”？

廣東人有多愛“刮刮樂”？,刮刮樂,彩票,即開型,體彩,彩民

2023-01-31 12:12

建議不因錢選工作專家實(shí)控多家公司專家稱年輕時不應(yīng)為錢去選擇工作

建議不因錢選工作專家實(shí)控多家公司專家稱年輕時不應(yīng)為錢去選擇工作,姚寧,海寧,控制權(quán)

2023-01-31 12:12

熱門文章

馬來西亞總理發(fā)話了：高盛必須盡快與政府了結(jié)1MDB丑聞

熱門推薦

2023成都積分入學(xué)什么時候開始申請

2023-01-31

科大訊飛劉慶峰：2022年穩(wěn)住了，將開啟利潤年增30%新時代

2023-01-31

究竟是什么神仙存單，竟能位列昔日人情往來Top1

2023-01-31

場內(nèi)ETF資金動態(tài)：節(jié)后車市有望恢復(fù)常態(tài)化節(jié)奏，汽車ETF上漲

2023-01-31

規(guī)劃53萬㎡+2棟幼兒園，華富北棚改發(fā)征收提示｜深圳樓市早7條

2023-01-31

最新文章

CopyRight 2022 http://yzzsnet.com All Rights Reserved. 智慧百科大全版權(quán)所有

聯(lián)系郵箱：[email protected]湘ICP備2023005268號-1

中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

<sub id="dxmnt"><ol id="dxmnt"></ol></sub>