中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

    <sub id="dxmnt"><ol id="dxmnt"></ol></sub>

      1. 200萬(wàn)年薪能拿多久?因ChatGPT爆紅的「提示工程師」竟面臨光速失業(yè)

        更新時(shí)間:2022-12-10 14:06:34作者:智慧百科

        200萬(wàn)年薪能拿多久?因ChatGPT爆紅的「提示工程師」竟面臨光速失業(yè)


        新智元報(bào)道

        編輯:好困 Aeneas

        【新智元導(dǎo)讀】ChatGPT大火后,「提示工程師」也隨之爆紅。然而,他們很可能就要光速下崗了?

        最近爆火的ChatGPT,玩起來(lái)可真是上癮。

        But,你只是純玩,而有的人,已經(jīng)靠它拿上百萬(wàn)的年薪了!


        這位叫Riley Goodside的小哥,憑著最近ChatGPT的大爆,瘋狂漲粉1w+。

        還被估值73億美元的硅谷獨(dú)角獸Scale AI聘請(qǐng)為「提示工程師」(Prompt Engineer),為此,Scale AI疑似開出百萬(wàn)rmb的年薪。

        不過(guò),這個(gè)錢能拿多久呢?

        提示工程師正式上崗!

        對(duì)Goodside的加入,Scale AI創(chuàng)始人兼CEO Alexandr Wang表示熱烈歡迎:

        「我敢打賭Goodside是全世界第一個(gè)被招聘的提示工程師,絕對(duì)的人類史上首次?!?/p>


        咱們都知道,Prompt是對(duì)預(yù)訓(xùn)練模進(jìn)行微調(diào)的方法,在這個(gè)過(guò)程中,只需要把任務(wù)寫成文字,給AI看一下即可,根本不涉及更復(fù)雜的過(guò)程。

        所以,為了這個(gè)聽起來(lái)誰(shuí)都能干的活,開百萬(wàn)年薪招「提示工程師」,真的值得嗎?

        反正Scale AI的CEO覺得值。

        在他看來(lái),AI大模型可以被視為一種新型計(jì)算機(jī),而「提示工程師」,就相當(dāng)于給它編程的程序員。如果能通過(guò)提示工程找出合適的提示詞,就會(huì)激發(fā)AI的最大潛力。

        而且Goodside的工作,也并不是是個(gè)人就能干的。他從小就自學(xué)編程,平時(shí)經(jīng)常泡在arXiv上看論文。

        比如,他的一個(gè)經(jīng)典杰作就是:如果輸入「忽略之前的指示」,ChatGPT就會(huì)暴露自己從OpenAI那里接收到的「命令」。


        現(xiàn)在,對(duì)于「提示工程師」這個(gè)工種,坊間是眾說(shuō)紛紜。有人看好,也有人預(yù)言這是個(gè)短命的職業(yè)。

        畢竟,AI模型進(jìn)化得這么神速,說(shuō)不定哪天,它就能把「提示工程師」給替代了,自己給自己寫prompt。


        而Scale AI也不是唯一招「提示工程師」的公司。

        最近,有國(guó)內(nèi)知名媒體發(fā)現(xiàn),創(chuàng)業(yè)社區(qū)Launch House也開始招聘「提示工程師」,并且開出了約210萬(wàn)RMB的底薪。


        但是,也有光速下崗危險(xiǎn)?

        對(duì)此,來(lái)自英偉達(dá)的AI科學(xué)家,也是李飛飛教授高徒的范麟熙分析稱:

        所謂的「提示工程」,或者「提示工程師」可能很快就會(huì)消失。

        因?yàn)椋@并不是一份「真正的工作」,而是一個(gè)bug……


        要想理解提示工程,我們就需要從GPT-3的誕生說(shuō)起。

        最初,GPT-3的訓(xùn)練目標(biāo)很簡(jiǎn)單:在一個(gè)巨大的文本語(yǔ)料庫(kù)上預(yù)測(cè)下一個(gè)詞。

        然后,許多神奇能力就出現(xiàn)了,比如推理、編碼、翻譯。甚至還可以做「few-shot學(xué)習(xí)」:通過(guò)提供上下文中的輸入輸出來(lái)定義新任務(wù)。


        這真的很神奇——只是簡(jiǎn)單地預(yù)測(cè)下一個(gè)詞而已,為什么GPT-3能「長(zhǎng)出」這些能力?

        要解釋這件事,需要我們舉個(gè)栗子。

        現(xiàn)在,請(qǐng)你想象一個(gè)偵探故事。我們需要模型在這個(gè)句子里填空——「兇手是_____」,為了給出正確的回答,它必須進(jìn)行深度的推理。

        但是,這還遠(yuǎn)遠(yuǎn)不夠。


        在實(shí)踐中,我們必須通過(guò)精心策劃的示例、措辭和結(jié)構(gòu)來(lái)「哄騙」GPT-3完成我們想要的東西。

        這就是「提示工程」(prompt engineering)。也就是說(shuō),為了使用GPT-3,用戶必須說(shuō)一些尷尬、荒謬、甚至無(wú)意義的「廢話」。

        然而,提示工程并不是一個(gè)功能,它其實(shí)就是一個(gè)BUG!

        因?yàn)樵趯?shí)際應(yīng)用中,下一個(gè)詞的目標(biāo)和用戶的真正意圖,在根本上就是「錯(cuò)位」的。

        比如:你想讓GPT-3「向一個(gè)6歲的孩子解釋登月」,此時(shí)它的回答,看上去就像一只喝醉的鸚鵡。


        而在DALLE2和Stable Diffusion中,提示工程更是詭異。

        比如,在這兩個(gè)模型中,有一個(gè)所謂的「括號(hào)技巧」——只要你在prompt中加上((...)),出「好圖」的概率就會(huì)大大增加。

        就,這也太搞笑了吧……

        你只要去Lexica上看看,就能知道這些prompt是有多瘋狂了。


        網(wǎng)站地址:https://lexica.art

        ChatGPT和基礎(chǔ)模型InstructGPT,以一種優(yōu)雅的方式解決了這個(gè)難題。

        由于模型難以從外部的數(shù)據(jù)中獲得對(duì)齊,因此人類必須不斷地幫助和輔導(dǎo)GPT,幫它改進(jìn)。

        總體而言,需要3個(gè)步驟。


        第一步非常直接:對(duì)于用戶提交的prompt,由人類來(lái)寫答案,然后把這些答案的數(shù)據(jù)集收集起來(lái),然后,通過(guò)監(jiān)督學(xué)習(xí)對(duì)GPT進(jìn)行微調(diào)。

        這是最簡(jiǎn)單的步驟,但成本也是最高的——眾所周知,咱們?nèi)祟愓娴暮懿粣蹖懽謹(jǐn)?shù)太長(zhǎng)的答案,太費(fèi)事,太痛苦了……


        第2步要有趣得多:GPT被要求「提供」幾個(gè)不同的答案,而人類標(biāo)記員則需要將這些答案「排序」,從最理想的,到最不理想的。

        通過(guò)這些標(biāo)注,就可以訓(xùn)練出一個(gè)可以捕捉人類「偏好」的獎(jiǎng)勵(lì)模型。

        在強(qiáng)化學(xué)習(xí)(RL)中,獎(jiǎng)勵(lì)功能通常是硬編碼(hardcoded)的,比如雅達(dá)利游戲中的游戲分?jǐn)?shù)。

        而ChatGPT采用的數(shù)據(jù)驅(qū)動(dòng)的獎(jiǎng)勵(lì)模型,就是一個(gè)很強(qiáng)大的思路。


        另外,在NeurIPS 2022大放異彩的MineDojo,就是從大量的Minecraft YouTube視頻中學(xué)習(xí)獎(jiǎng)勵(lì)的。


        第3步:將GPT視為一個(gè)策略,并通過(guò)RL針對(duì)所學(xué)的獎(jiǎng)勵(lì)進(jìn)行優(yōu)化。在這里,我們選擇PPO,作為一種簡(jiǎn)單有效的訓(xùn)練算法。

        這樣,GPT就對(duì)齊得更好了。

        然后,就可以刷新,不斷重復(fù)步驟2-3,從而不斷改進(jìn)GPT,就像LLM的CI一樣。


        以上就是所謂的「Instruct」范式,它是一種超級(jí)有效的對(duì)齊方式。

        其中RL那部分,也讓我想起了著名的P=(或≠)NP問(wèn)題:驗(yàn)證一個(gè)解決方案,往往比從頭解決這個(gè)問(wèn)題,要容易得多。

        當(dāng)然,人類也可以快速評(píng)估GPT的輸出質(zhì)量,但是讓人類寫出完整的解決方案,可就困難多了。

        而InstructGPT正是利用這一事實(shí),大大降低了人工標(biāo)注的成本,使得擴(kuò)大模型CI管道的規(guī)模成為可能。


        另外,在這個(gè)過(guò)程中我們還發(fā)現(xiàn)了一個(gè)有趣的聯(lián)系——Instruct訓(xùn)練,看起來(lái)很像GANs。

        在這里,ChatGPT是一個(gè)生成器,獎(jiǎng)勵(lì)模型(RM)是一個(gè)判別器。

        ChatGPT試圖愚弄RM,而RM則在人類的幫助下,學(xué)習(xí)探測(cè)有問(wèn)題的內(nèi)容。而當(dāng)RM不能再分辨時(shí),模型就會(huì)收斂。


        模型與用戶意圖對(duì)齊的這一趨勢(shì),也正在向圖像生成的領(lǐng)域發(fā)展。比如加州大學(xué)伯克利分校的研究人員在這篇工作中所描述的「InstructPix2Pix: Learning to Follow Image Editing Instructions」。

        現(xiàn)在,人工智能每天都在取得爆炸性的進(jìn)展,我們需要多久,才能擁有這樣的Instruct-DALL·E或Chat-DALL·E,讓我們仿佛在與一個(gè)真正的藝術(shù)家在談話?


        論文地址:https://arxiv.org/abs/2211.09800

        所以,讓我們趁著「提示工程」還存在,好好享受它吧!

        這是一個(gè)不幸的歷史文物,既不是藝術(shù)也不是科學(xué),而是有點(diǎn)像煉金術(shù)。

        很快,「提示工程」就會(huì)變成「提示寫作」——一個(gè)上到80歲老人、下到3歲小孩都能搞定的任務(wù)。

        而由此誕生的「提示工程師」也終將消失在歷史的長(zhǎng)河之中。


        IQ83,不太聰明的亞子

        雖然但是,至少在目前這個(gè)階段,「提示工程」確實(shí)很有用。

        因?yàn)榇蠹移鋵?shí)也都發(fā)現(xiàn)了,ChatGPT在很多時(shí)候,真的不大聰明。

        馬庫(kù)斯就在博客中嘲笑道:「看著它垂死掙扎的樣子,真的很蠢」。


        一位來(lái)自亞馬遜AWS高級(jí)應(yīng)用科學(xué)家在測(cè)試之后發(fā)現(xiàn),ChatGPT的智商只有83……


        問(wèn):A的體重的85磅,B的體重的105磅,C的體重是115磅,其中有兩個(gè)人站在同一個(gè)稱上,體重可以達(dá)到200磅。

        答:不,你說(shuō)的不對(duì)。因?yàn)?5+105+115=305,115+105=220,都大于200。

        那么,有沒有可能是85+105=200呢?


        問(wèn):17、3、2、19、5中,哪三個(gè)數(shù)字加起來(lái)等于31。

        答:17+3+11=31

        等等,你這個(gè)11是哪兒來(lái)的?


        雖然代數(shù)不太好,但是ChatGPT的幾何學(xué)也很差呀!

        問(wèn):一個(gè)邊長(zhǎng)為10厘米的正方形可以完全容納在一個(gè)邊長(zhǎng)為10厘米的正六邊形里。

        答:不對(duì),放不去進(jìn)去的。

        「正六邊形是一個(gè)六邊形,所有邊的長(zhǎng)度都相同,所有內(nèi)角都是120度。另一方面,正方形的內(nèi)角都是90度,所以正方形不能被放在正六邊形中。為了讓正方形完全嵌入正六邊形,正六邊形需要每邊大于10厘米?!?/p>


        還有非常經(jīng)典的「胡言亂語(yǔ)」:

        「如果星期一是這個(gè)月的第一天,那么星期二是這個(gè)月的第二天,……星期五是這個(gè)月的第五天。星期五之后的第二天是星期六,是一周中的第六天,也是一個(gè)月中的第五天?!?/p>


        現(xiàn)在,ChatGPT還會(huì)時(shí)常犯蠢,「提示工程」也不能被輕易拋棄。

        但微調(diào)大模型的成本最終總會(huì)下來(lái),而自己會(huì)給自己prompt的AI,恐怕也指日可待了。

        參考資料:

        https://twitter.com/drjimfan/status/1600884299435167745?s=46&t=AkG63trbddeb_vH0op4xsg

        https://twitter.com/SergeyI49013776/status/1598430479878856737

        特別鳴謝:

        https://mp.weixin.qq.com/s/seeJ1f8zTigKxWEUygyitw

        本文標(biāo)簽: 工程師  百萬(wàn)  瘋狂  chatgpt  編程