理財(cái)和基金的區(qū)別 關(guān)于理財(cái)和基金的區(qū)別介紹
2023-01-26
更新時(shí)間:2022-06-05 14:35:25作者:未知
金磊 Alex 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
誰(shuí)能想到,宋朝的老虎們,有一天能在國(guó)外被玩兒火了。
事情是這樣的。
前不久谷歌不是出了個(gè)AI創(chuàng)作神器Imagen嘛。
只要你給一句話,它就能生成符合語(yǔ)意的圖片。
然后腦洞大開(kāi)的國(guó)外網(wǎng)友們,不按套路地給Imagen出了道題:
Imagen也沒(méi)在怕的,“啪的一下”就給出了一幅力作——《虎戴VR》。
還別說(shuō),這幅《虎戴VR》還真是有點(diǎn)那味了。
不僅是畫(huà)風(fēng)上,VR頭戴跟老虎以及整幅畫(huà)作能夠保持一致。
就連手柄、雙虎嬉戲的感覺(jué)也都一步到位地畫(huà)了出來(lái)。
然后還有兩只老虎戴VR,手牽著手一起“恰恰恰”的:
甚至Imagen還別出心裁地設(shè)計(jì)了個(gè)“連線”版VR(可能在面對(duì)面看片吧):
但畢竟在AI作畫(huà)這事上,除了谷歌Imagen之外還有很多神器。
于是,一場(chǎng)《虎戴VR》作畫(huà)大戰(zhàn)就此拉開(kāi)序幕。
(猜猜誰(shuí)家的畫(huà)更有“心有猛虎,細(xì)嗅薔薇”的味道)
首先來(lái)應(yīng)戰(zhàn)的,定然是OpenAI家的DALL·E。
網(wǎng)友Jacob出于好奇,便用它做了幾幅來(lái)做比較。
首先是滿滿“定妝照”風(fēng)格的《虎戴VR》(很颯?。?/p>
不難看出,DALL·E的畫(huà)作和Imagen在風(fēng)格上還是有很大的區(qū)別。
Imagen的畫(huà)作更趨于簡(jiǎn)約線條風(fēng),而DALL·E則更多了些許油畫(huà)的元素。
不過(guò)在意境方面,DALL·E也是能夠產(chǎn)出“雙虎嬉戲”,甚至是擬人的畫(huà)作:
二者相比之下,網(wǎng)友們給出了他們的評(píng)價(jià):
大多數(shù)網(wǎng)友們對(duì)谷歌家的Imagen更買單。
而除了它倆之外,像AI繪畫(huà)神器MidJourney也參與到了此次“大戰(zhàn)”。
不過(guò)它的作品,就顯得略有些詭異了……
那么,同樣作為AI創(chuàng)作神器,最近大火的Imagen和DALL·E為何畫(huà)風(fēng)會(huì)截然不同呢?
Open AI的DALL·E和谷歌的Imagen,都可以直接通過(guò)文本描述生成類似超現(xiàn)實(shí)主義的圖像,讓機(jī)器也能擁有設(shè)計(jì)師般的創(chuàng)造力。
不過(guò),二者的“創(chuàng)作”原理大相徑庭。
DALL·E 2采用CLIP將文本特征映射到圖像特征,然后指導(dǎo)一個(gè)GAN或擴(kuò)散模型生成圖像。
所謂CLIP,是一個(gè)在各種圖像和文本上訓(xùn)練的神經(jīng)網(wǎng)絡(luò),對(duì)生成的多張圖片進(jìn)行排序,挑選出更好的生成結(jié)果進(jìn)行展示。
而谷歌的Imagen則使用純語(yǔ)言模型只負(fù)責(zé)編碼文本特征,把文本到圖像轉(zhuǎn)換的工作丟給了圖像生成模型。
語(yǔ)言模型部分使用的是谷歌自己的T5-XXL編碼器,將訓(xùn)練好的文本凍結(jié)。
圖像生成部分則是一系列擴(kuò)散模型,先生成低分辨率圖像,再逐級(jí)超采樣。
谷歌的T5-XXL有46億個(gè)參數(shù),而擴(kuò)大文本編碼器的規(guī)模,可以有效改善文本到圖像的對(duì)應(yīng)關(guān)系,和圖像的保真度。
此外,Imagen還使用了另一種稱為noise conditioning augmentation的擴(kuò)散技術(shù),幫助模型學(xué)習(xí)已添加的噪聲量,從而提高圖像的還原性。
對(duì)比來(lái)看,Imagen似乎比DALL·E更具有“寫(xiě)實(shí)”的特點(diǎn):
目前,在Imagen官網(wǎng)上已涌現(xiàn)出各種新奇的圖像。
有人給浣熊戴上了宇航員頭盔。
泰迪熊在這里開(kāi)始游蝶泳。
還有老鷹型的巧克力冰淇淋(嗯,還挺應(yīng)景)。
截至目前,Imagen和DALL·E都還在調(diào)試階段,尚未向公眾開(kāi)放。
這次《虎戴VR》AI作畫(huà)大戰(zhàn)中,也不乏有失敗的作品。
例如有網(wǎng)友就給出了用DALL·E mini來(lái)生成的示例。
不難看出,在這版中的《虎戴VR》中,并沒(méi)有任何VR的出現(xiàn),而且老虎的面部基本上都是模糊不清。
據(jù)網(wǎng)友描述,他在生成的過(guò)程中,只是把“北宋”改成了“南宋”:
那么你覺(jué)得對(duì)于《虎戴VR》,哪家AI神器表現(xiàn)更出色呢?
https://twitter.com/hardmaru/status/1532757753797586944?s=21&t=MhwVN5VXH22zFK7DWQJnCg