中文字幕亚洲欧美日韩在线不卡,亚洲欧美日产综合在线网性色,思思久久精品6一本打道,综合视频中文字幕

    <sub id="dxmnt"><ol id="dxmnt"></ol></sub>

      1. 科大訊飛被曝加緊開發(fā)中國版ChatGPT,具體發(fā)布時間已確定

        更新時間:2023-02-10 18:05:21作者:智慧百科

        科大訊飛被曝加緊開發(fā)中國版ChatGPT,具體發(fā)布時間已確定

        楊凈 蕭簫 發(fā)自 凹非寺
        量子位 | 公眾號 QbitAI

        ChatGPT火熱,國內(nèi)玩家接連爆出加緊開發(fā)中國版ChatGPT的消息。

        現(xiàn)在又最新獲悉:科大訊飛也加入此列中。

        并且發(fā)布就會是直接落地場景的產(chǎn)品,具體時間也已經(jīng)確定:5月6日。

        這是ChatGPT火得一塌糊涂之下,最快給出具體時間的國產(chǎn)玩家。

        更早之前,一眾互聯(lián)網(wǎng)玩家包括百度360阿里網(wǎng)易京東官宣入局之際,關(guān)于誰能打造中國版ChatGPT的問題也爭得一塌糊涂。



        事實(shí)上,自ChatGPT上線以來,作為A股AI龍頭科大訊飛就備受市場關(guān)注,一直被基金瘋狂調(diào)研和熱捧。

        據(jù)證券時報消息,截至2022年四季度末,80只基金重倉持有科大訊飛6100萬股,去年四季度基金大幅加倉1807萬股。

        有著數(shù)十年技術(shù)產(chǎn)業(yè)積累的科大訊飛,也被認(rèn)為是國內(nèi)最有希望打造ChatGPT的玩家之一。

        但問題是,包括訊飛在內(nèi)的中國玩家是否真的有希望復(fù)刻ChatGPT?至少從技術(shù)維度來看,又應(yīng)該具備什么樣的條件?

        打造中國版ChatGPT需要什么條件?

        ChatGPT的打造,核心繞不過算法、數(shù)據(jù)、算力三要素。

        算力是支撐背后大語言模型訓(xùn)練的硬件基礎(chǔ);數(shù)據(jù),影響模型能力強(qiáng)弱甚至生成質(zhì)量的關(guān)鍵;算法則包括模型架構(gòu)和優(yōu)化方法,決定著模型的核心技能。

        如果說前兩者算力和數(shù)據(jù)是資本資源積累,畢竟訓(xùn)練一個1750億參數(shù)的GPT-3就得花費(fèi)460萬美元;那么算法是ChatGPT區(qū)別于其他的獨(dú)到之處。

        作為一個對話式AI,ChatGPT所具備的技能包括多語言文本生成、具備大量世界知識、零樣本生成、代碼理解和生成、對話能力等。



        更概括地來說,其強(qiáng)大之處在于同時具備知識、推理和溝通能力——

        也是實(shí)現(xiàn)認(rèn)知智能必備的幾項(xiàng)能力。

        首先是知識能力。為了讓ChatGPT既具備應(yīng)用數(shù)據(jù)能力、又能生成符合人類要求的答案,要求它能具備大量世界知識和基礎(chǔ)常識,且符合人類輸出要求。

        這背后不僅離不開ChatGPT“底座”大語言模型的參數(shù)量和算法架構(gòu),更離不開極高的數(shù)據(jù)質(zhì)量。

        值得注意的是,ChatGPT比其他AI模型生成質(zhì)量高的原因,在于它更了解人類的“雷區(qū)”,包括回答中立客觀、不輸出違規(guī)內(nèi)容、不回答認(rèn)知范圍之外的問題等。

        嚴(yán)格來說,這不僅需要各行業(yè)通用的高質(zhì)量數(shù)據(jù),而且還需要經(jīng)過大量數(shù)據(jù)清洗和人工標(biāo)注。

        這種方法被命名為基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF),需要經(jīng)過大量各行各業(yè)的人工標(biāo)注,僅憑模型自身無法達(dá)到這樣的效果。

        隨后是推理能力。這包括理解并生成代碼等技能,讓模型能像人一樣,一步步思考并推算目標(biāo)結(jié)果。

        這里面考驗(yàn)的又不僅僅是代碼和語言數(shù)據(jù)量,同樣還強(qiáng)調(diào)模型的零樣本生成能力和復(fù)雜推理能力。

        具體而言,零樣本生成指的是模型完成沒見過的新任務(wù)的能力,而代碼生成更是考驗(yàn)?zāi)P透鶕?jù)任務(wù)目標(biāo),一步步推理生成最終結(jié)果的能力。



        最后便是溝通能力,即多語言文本生成、對話能力等。

        ChatGPT之所以在溝通能力上有所進(jìn)步,是因?yàn)樗軐W(xué)會基于之前的對話內(nèi)容生成新輸出,而并非局限于當(dāng)前對話中、導(dǎo)致無法理解代詞或暗含前文信息點(diǎn)的詞。

        這背后除了要求模型在預(yù)訓(xùn)練時的語言文本具有多樣性,還必須增加如指令學(xué)習(xí)在內(nèi)的任務(wù),確保模型能更好地聽懂人類對話中的要求,并準(zhǔn)確合理地實(shí)現(xiàn)。

        綜上來看,ChatGPT在各方面都提出了不低的要求,國內(nèi)玩家要想打造這樣的模型,就必須在NLP乃至認(rèn)知智能相關(guān)的算法上,實(shí)現(xiàn)深厚積淀。

        國內(nèi)玩家有希望嗎?

        既然如此,那么國內(nèi)的玩家來打造ChatGPT有希望嗎?

        從目前已被曝出玩家來看,主要有兩類企業(yè)想要搶占ChatGPT的高地。

        一類是網(wǎng)絡(luò)搜索領(lǐng)域,這個被認(rèn)為ChatGPT率先顛覆的場景,微軟谷歌之爭也在此再次打響。而回到國內(nèi),搜索引擎的兩大巨頭都表示對ChatGPT的持續(xù)關(guān)注。

        一邊,百度官宣即將上線文心一言;另一邊,周鴻祎也肯定表示:360不會放棄對ChatGPT這門技術(shù)的研究和跟蹤。

        另一類則是其他專業(yè)領(lǐng)域的玩家,比如聚焦于電商物流的阿里京東、文娛場景下的騰訊網(wǎng)易,還有像教育醫(yī)療場景深耕的科大訊飛……

        不妨就從這兩類玩家入手,以百度和科大訊飛為例,來看看是否真的有希望。他們一個是搜索引擎代表,一個所代表的場景有廣泛的社會價值。



        圖注:圖源科大訊飛,智醫(yī)助理電話機(jī)器人

        如前所言,想要打造ChatGPT,需要算法、數(shù)據(jù)和算力三個方面。

        首先從算法上,目前國內(nèi)很多公司都有NLP技術(shù)和預(yù)訓(xùn)練語言模型的研究和開發(fā)。百度有文心大模型,而AI龍頭科大訊飛自然更是在這兩方面,有諸多研究積累——

        在NLP所在的認(rèn)知智能領(lǐng)域,科大訊飛主導(dǎo)承建了認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室(科技部首批20家標(biāo)桿全國重點(diǎn)實(shí)驗(yàn)室之一),多年來始終保持關(guān)鍵核心技術(shù)處于世界前沿水平,比如在去年就獲得CommonsenseQA 2.0、OpenBookQA等12項(xiàng)認(rèn)知智能領(lǐng)域權(quán)威評測的第一;

        而在預(yù)訓(xùn)練語言模型上,還面向認(rèn)知智能領(lǐng)域陸續(xù)開源了6大類、超過40個通用領(lǐng)域的系列中文預(yù)訓(xùn)練語言模型,成為業(yè)界最廣泛流行的中文預(yù)訓(xùn)練模型系列之一,在Github獲13346顆星,位列中文預(yù)訓(xùn)練模型星標(biāo)數(shù)第一。



        從這個維度上看,中國玩家是有希望造出一個類ChatGPT模型。

        但要造出一個高質(zhì)量的語言模型,需要大量的數(shù)據(jù)和計算資源。

        數(shù)據(jù)方面,諸多現(xiàn)象表明,數(shù)據(jù)多少是決定模型智能與否的關(guān)鍵。一度驚艷眾人的GPT-3就有1750億參數(shù),而上一版本GPT-2只有15億參數(shù)。

        百度360這樣的搜索引擎玩家,有著天然的通用數(shù)據(jù)來源。不過之后的數(shù)據(jù)清洗和人工標(biāo)注也是難度不小的工程。

        而像科大訊飛,雖然沒有像前兩者有通用數(shù)據(jù)上的優(yōu)勢。但在教育、醫(yī)療這種高壁壘、高門檻的領(lǐng)域有規(guī)?;膶I(yè)數(shù)據(jù)積累,并且有在訊飛輸入法、訊飛開放平臺、消費(fèi)辦公類產(chǎn)品帶來的大量數(shù)據(jù),

        待到ChatGPT行業(yè)落地時,可以迅速占領(lǐng)市場高地。

        再來看計算資源方面,實(shí)際上看的是愿意投入的成本有多少。

        OpenAI背靠微軟這樣一頭算力奶?!獡碛?8.5萬個CPU核心、1萬個英偉達(dá)V100 GPU,光是訓(xùn)練一個GPT-3,費(fèi)用就高達(dá)460萬美元。

        國內(nèi)像百度、科大訊飛這類數(shù)十年的AI玩家,自然有諸多算力和資金的積累。而且也有生態(tài)鏈上的合作伙伴,想必也會是水到渠成的。

        巧合的是,訊飛在今年年初提出了要開啟高質(zhì)量發(fā)展——將在未來5年實(shí)現(xiàn)500億根據(jù)地業(yè)務(wù)營收、200億毛利,可提供物質(zhì)保障;另一方面,還有中國玩家繞不開的國產(chǎn)替代的考量,近年來訊飛一直推進(jìn)在算力和算法上的自主可控。

        據(jù)官方數(shù)據(jù),目前研發(fā)訓(xùn)練服務(wù)器已經(jīng)開始進(jìn)入國產(chǎn)化, 切換之后效率有的是原來平臺的 70-80%,有的效率是超原來平臺100+%。另外在算法上,也啟動了推理服務(wù)器的國產(chǎn)替代;像部分產(chǎn)品,學(xué)習(xí)機(jī)芯片已經(jīng)全部切換成國產(chǎn)自主。



        不可否認(rèn)的是,我們跟ChatGPT是有先天的技術(shù)差距。但至少從算法、算力和數(shù)據(jù)這三個基本盤來看,想要打造一個中國版ChatGPT也并非沒有希望。

        中美在打造ChatGPT上的差異

        重新回到事件本身,就在一眾中國玩家開始著手打造類ChatGPT產(chǎn)品之際,一個繞不開的問題是,中國明明不缺ChatGPT技術(shù),為什么不是中國先誕生ChatGPT?中美之間在打造ChatGPT上差異有多大?

        背后原因在此之前也沒有進(jìn)行系統(tǒng)性梳理過。歸結(jié)起來,主要有三個層面。

        其一,AI應(yīng)用落地的行業(yè)路線差異。

        ChatGPT作為AGI(通用人工智能)技術(shù)代表,對于商業(yè)化落地而言,本身不是一個“好生意”。

        之所以這么說,是因?yàn)樵谙喈?dāng)長的一段時間內(nèi),AGI的商業(yè)前景其實(shí)都并不為業(yè)內(nèi)和大多玩家所看好。

        除了前期訓(xùn)練算力和數(shù)據(jù)投入的大量資金,后期優(yōu)化和知識更新所需的迭代路線,無法像互聯(lián)網(wǎng)商業(yè)模式創(chuàng)新那樣快速變現(xiàn)增長。

        在國內(nèi)市場大環(huán)境中,并不是一個好的選擇。相比之下,國內(nèi)大多數(shù)科技廠商更傾向于在垂直專業(yè)領(lǐng)域應(yīng)用AI技術(shù),如推出針對不同行業(yè)的專業(yè)大模型、又例如采用預(yù)訓(xùn)練+微調(diào)的模式,針對更具體的場景用專業(yè)數(shù)據(jù)去調(diào)整差異……

        這并不意味著垂直專業(yè)領(lǐng)域的AI應(yīng)用一定比通用AI更差,甚至在某些領(lǐng)域上,經(jīng)過專業(yè)數(shù)據(jù)訓(xùn)練的AI表現(xiàn)仍然比ChatGPT更好。

        然而ChatGPT的成功,意味著通用模型以后也會成為商業(yè)化落地的方向之一,甚至覆蓋原先一些AI技術(shù)不高、專業(yè)度不夠的場景落地應(yīng)用,如銀行客服等。



        其二,中美在ChatGPT技術(shù)上的差距。

        如前所述,中國不缺ChatGPT技術(shù)。如科大訊飛研究的認(rèn)知智能中,對于ChatGPT具備的自然語言理解、知識推理技術(shù)都已有所布局,相關(guān)全球基準(zhǔn)測試中,成績均達(dá)到了全球領(lǐng)先水平。

        然而,如何將這些模型能力集成升級、達(dá)到ChatGPT的效果,又如何搜集并產(chǎn)生巨量的高質(zhì)量通用數(shù)據(jù)、而非僅僅是某一行業(yè)的專業(yè)數(shù)據(jù),國內(nèi)外目前依舊存在差距。

        更明確一點(diǎn)來說,存在技術(shù)代差。

        360在最近電話會議中表示:

        國內(nèi)的技術(shù)水平目前整體在GPT2.3左右。如果基于互聯(lián)網(wǎng)優(yōu)勢,大家都用中文提問、尤其是國內(nèi)的問題,可能實(shí)際體驗(yàn)?zāi)苓_(dá)到GPT2.5版本左右。

        但OpenAI這邊,GPT-4早就已經(jīng)呼之欲出,中美之間基本已存在一代多的技術(shù)差距。

        其三,技術(shù)引發(fā)的生態(tài)差距。

        GPT-3之后OpenAI所有的模型都沒有開源,而是提供了API調(diào)用,并因此養(yǎng)活了美國一大幫創(chuàng)業(yè)公司,創(chuàng)造并盤活了整個生態(tài)。

        清華大學(xué)計算機(jī)科學(xué)與技術(shù)系長聘副教授黃民烈,就曾這樣形象地描述GPT系列模型的影響力:

        這個過程它干了一件事,就是建立起了真實(shí)的用戶調(diào)用和模型迭代之間的飛輪,它非常重視真實(shí)世界數(shù)據(jù)的調(diào)用,以及這些數(shù)據(jù)對模型的迭代。

        相比之下,國內(nèi)目前更多公司雖然開源了不少大模型,然而這些模型要想達(dá)到商業(yè)化落地效果,仍舊需要大量數(shù)據(jù)迭代乃至應(yīng)用落地,這方面的費(fèi)用絕非初創(chuàng)公司所能承擔(dān)。

        事實(shí)上,從技術(shù)、行業(yè)乃至生態(tài)差距來看,ChatGPT依靠的不是短期的角逐,而是一個長線投資行為。

        目前,應(yīng)用領(lǐng)域可能還集中在搜索引擎上,但隨著ChatGPT應(yīng)用潛力被各個領(lǐng)域挖掘出來,最終可能打造國產(chǎn)ChatGPT的,還是那些在技術(shù)、行業(yè)以及有能力構(gòu)建生態(tài)的玩家中,科大訊飛是一個。

        總之,關(guān)于全球ChatGPT之爭,號角已經(jīng)吹響。關(guān)乎ChatGPT落地價值探索,國內(nèi)玩家已經(jīng)起航。


        本文標(biāo)簽: 算法  科大訊飛  科技巨頭  chatgpt  

        為您推薦

        財聯(lián)社2月13日電,據(jù)“清廉浙江”通報,物產(chǎn)中大公用環(huán)境投資有限公司原董事長楊東偉涉嫌嚴(yán)重違法,目前正在接受杭州市上城區(qū)監(jiān)委監(jiān)察調(diào)查。

        財聯(lián)社2月13日電,據(jù)“清廉浙江”通報,物產(chǎn)中大公用環(huán)境投資有限公司原董事長楊東偉涉嫌嚴(yán)重違法,目前正在接受杭州市上城區(qū)監(jiān)委監(jiān)察調(diào)查。,杭州市,上城區(qū),楊東偉,浙江省,大運(yùn)河,物產(chǎn)中大,監(jiān)察調(diào)查,中國文物,中國世界遺產(chǎn)

        2023-02-13 17:12

        南昌高新區(qū):給予人才購房補(bǔ)貼 最高800元/平米

        南昌高新區(qū):給予人才購房補(bǔ)貼 最高800元/平米,

        2023-02-13 17:12

        科技企業(yè)高管談ChatGPT爆火:元宇宙概念很模糊,但已經(jīng)在用AI了

        科技企業(yè)高管談ChatGPT爆火:元宇宙概念很模糊,但已經(jīng)在用AI了,元宇宙,ai,chatgpt

        2023-02-13 17:12

        外交部介紹王毅訪俄目的和考慮:同俄方一道推動雙邊關(guān)系

        外交部介紹王毅訪俄目的和考慮:同俄方一道推動雙邊關(guān)系 ,王毅,中俄關(guān)系,汪文斌,外交部,中俄

        2023-02-13 17:10

        路博邁基金周平:保持敬畏之心,追求安全、穩(wěn)健且可復(fù)制的長線收益

        路博邁基金周平:保持敬畏之心,追求安全、穩(wěn)健且可復(fù)制的長線收益,外資,公募,長線收益,路博邁基金,機(jī)構(gòu)調(diào)研記錄,周平(1968年)

        2023-02-13 17:08

        規(guī)模誠可貴,業(yè)績價更高!限購、增聘…這些熱門基金打出控規(guī)模組合拳!

        規(guī)模誠可貴,業(yè)績價更高!限購、增聘…這些熱門基金打出控規(guī)模組合拳!,廣發(fā),限購,增聘,和基金,基金產(chǎn)品,公募基金

        2023-02-13 17:08