国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

網絡消費網 >  科技 > > 正文
透過ChatGPT的進化足跡,OpenAI傳達了哪些信號?
時間:2022-12-14 20:56:57

古希臘神話中,一位名叫赫爾墨斯的神,會充當人神之間的信使,穿著帶有雙翼的飛鞋,行走在神明與人類之間。

根據《荷馬史詩》的記載:“在天神中,赫爾墨斯是最喜歡引導凡人前行的?!边@句話用來形容OpenAI與AI的關系,雖不中亦不遠矣。


(資料圖)

上一周,OpenAI打造的ChatGPT出盡風頭,成為國內外AI領域的頭號熱門話題。關于ChatGPT的對話能力,大家可能已經通過很多文章感受過了。簡單總結,就是對答如流,無所不能,可替程序員寫代碼,可替商務人士出方案,還能替作家編故事。一度讓久違的 “谷歌已死”“XX職業又要被AI取代了”之類的AI威脅論說辭,開始大量出現了。

關于ChatGPT的神奇之處,看多了也有點審美疲勞了,冷靜下來思考一下:

為什么同樣是AIGC,問答、對話這類NLP領域應用更容易引起轟動,激發人們對通用人工智能的希望?

為什么同樣是預訓練模型,相比BERT、GPT3等前輩,ChatGPT的對話能力產生了質的飛躍?

為什么同樣是做AI,OpenAI要死磕NLP,從GPT1到 ChatGPT不斷迭代?

OpenAI的CEO、聯合創始人 Sam Altman曾說過一句話:“Trust the exponential,Flat looking backwards,vertical looking forwards”,相信指數的力量,平行地向后看,垂直地向前看。ChatGPT出現代表著,AI似乎已經站到了指數級飛躍的關鍵點上。但起飛的ChatGPT,并不是一蹴而就的。

從GPT到ChatGPT,恰好代表了OpenAI在大模型領域切實走過的歷程,從中可以看到,OpenAI在AI大模型競爭中,已經探索出了一條屬于自己的道路,就如同赫爾墨斯一樣,成為引領AI技術前進的使者。

如果OpenAI是傳遞AI前沿進展的赫爾墨斯,ChatGPT就是那雙帶著雙翼的金絲鞋。我們既要關注ChatGPT這雙鞋究竟有多神奇,更有必要搞懂,OpenAI選擇的這條大模型道路有何玄機。

今天,中國科技企業與研究機構都在積極投布局大模型,求術不如問道,我們不妨從GPT這一系列模型的演變歷程,望向OpenAI關于AI與大模型的戰略思考與發展脈絡。

從GPT-1到ChatGPT,超神模型的演化足跡

OpenAI在博客中寫道,ChatGPT 是從 GPT3.5 系列中的模型進行微調而誕生的。

正如名稱中所暗示的那樣,GPT- 3.5是OpenAI設計的一系列NLP模型中的第四個,此前還出現了GPT - 1、GPT - 2 和 GPT - 3。

在 GPT 出現之前,NLP 模型主要是基于針對特定任務的大量標注數據進行訓練。這會導致一些限制:

大規模高質量的標注數據不易獲得;

模型僅限于所接受的訓練,泛化能力不足;

無法執行開箱即用的任務,限制了模型的落地應用。

為了克服這些問題,OpenAI走上了預訓練大模型的道路。從GPT1到ChatGPT,就是一個預訓練模型越來越大、效果越來越強的過程。當然,OpenAI的實現方式并不只是“大力出奇跡”那么簡單。

第一代:從有監督到無監督GPT-1。2018年,OpenAI推出了第一代生成式預訓練模型GPT-1,此前,NLP任務需要通過大規模數據集來進行有監督的學習,需要成本高昂的數據標注工作,GPT-1的關鍵特征是:半監督學習。先用無監督學習的預訓練,在 8 個 GPU 上花費 了1 個月的時間,從大量未標注數據中增強AI系統的語言能力,獲得大量知識,然后進行有監督的微調,與大型數據集集成來提高系統在NLP任務中的性能。

GPT-1的效果明顯,只需要極少的微調,就可以增強NLP模型的能力,減少對資源和數據的需求。同時,GPT-1也存在明顯的問題,一是數據局限性,GPT-1 是在互聯網上的書籍和文本上訓練的,對世界的認識不夠完整和準確;二是泛化性依然不足,在一些任務上性能表現就會下降。

第二代:更大更高更強的GPT-2。2019年推出的GPT-2,與GPT-1并沒有本質上的不同(注意這一點),架構相同,使用了更大的數據集WebText,大約有40 GB的文本數據、800萬個文檔,并為模型添加了更多參數(達到驚人的 15 億個參數),來提高模型的準確性,可以說是加強版或臃腫版的GPT-1。

GPT-2的出現,進一步證明了無監督學習的價值,以及預訓練模型在下游NLP任務中的廣泛成功,已經開始達到圖靈測試的要求,有研究表示,GPT-2生成的文本幾乎與《紐約時報》的真實文章(83%)一樣令人信服。

(GPT-2表現)

第三代:跨越式進步的GPT-3。2020年,GPT-3的這次迭代,出現了重大的飛躍,成為與GPT-2迥然不同的物種。

首先,GPT-3的體量空前龐大,擁有超過 1750 億個參數,是GPT-2的 117 倍;其次,GPT-3不需要微調,它可以識別到數據中隱藏的含義,并運用此前訓練獲得的知識,來執行下游任務。這意味著,哪怕從來沒有接觸過的示例,GPT-3就能理解并提供不錯的表現。因此,GPT-3也在商業應用上表現出了極高的穩定性和實用性,通過云上的 API訪問來實現商業化。這種入得了實驗室、下得了車間的能力,使得GPT-3成為2020年AI領域最驚艷的模型之一。

當然,GPT-3也并不完美。正如聯合創始人 Sam Altman所說,GPT-3的水平仍處于早期階段,有時候也會犯非常愚蠢的錯誤,我們距離真正的人工智能世界還有很長的距離。另外,GPT-3 API 的很多基礎模型非常龐大,需要大量的專業知識和性能優異的機器,這使得中小企業或個人開發者使用起來比較困難。

第四代:基于理解而生成的ChatGPT。終于在2022年,OpenAI的預訓練語言模型之路,又出現了顛覆式的迭代,產生了技術路線上的又一次方向性變化:基于人工標注數據+強化學習的推理和生成。

前面提到,一開始預訓練模型的出現,是為了減少監督學習對高質量標注數據的依賴。而ChatGPT在GPT -3.5大規模語言模型的基礎上,又開始依托大量人工標注數據(據說OpenAI找了40個博士來標數據),這怎么又走回監督學習的“老路”了呢?

原因是,GPT 3.5雖然很強,但無法理解人類指令的含義(比如寫一段博文、改一段代碼),無法判斷輸入,自然也就很難給出高質量的輸出答案。所以OpenAI通過專業的標注人員(據說是40個博士)來寫詞條,給出相應指令/問題的高質量答案,在基于這些數據來調整GPT -3.5的參數,從而讓GPT -3.5具備了理解人類指令的能力。

在人工標注訓練數據的基礎上,再使用強化學習來增強預訓練模型的能力。強化學習,簡單理解就是做對了獎勵、做錯了懲罰,不斷根據系統的打分來更新參數,從而產生越來越高質量的回答。所以這幾天很多人在互動中發現,ChatGPT會承認錯誤、會修改自己的答復,這正是因為它具備從人類的反饋中強化學習并重新思考的能力。

因為ChatGPT具備了理解能力,所以才被看作是通向通用人工智能AGI的路徑。

當然,ChatGPT也并不是完美進化體。OpenAI的官網明確提示,ChatGPT“可能偶爾會生成不正確的信息”,并且“對2021年之后的世界和事件的了解有限”。一些比較難的知識,比如“紅樓夢講了什么”,ChatGPT會一本正經地胡說八道。

從GPT模型的演進和迭代中,可以看到OpenAI是不斷朝著自然語言理解這一目標前進,用更大的模型、更先進的架構,最終為通用人工智能找到了一條路徑。

從GPT-1到ChatGPT的縱向演變,會看到OpenAI對大模型的獨特理解與技術脈絡——通過模型預訓練提升NLP指標,抵達強人工智能。NLP領域究竟特殊在哪里,值得OpenAI如此執著?

OpenAI的大模型差異化之路

前文中不難看出,OpenAI對于文本生成模型的執著,因為做夠得久、投入夠多,所以能夠做得更好,是非常有長期戰略定力的。

與之相比,和GPT-1同年推出的預訓練模型,還有谷歌發布的BERT,但后者在火爆一段時間之后影響力明顯減弱;而NLP問答領域一向由Meta引領,Meta AI 的 OPT 模型和GPT-3 達到了同等的參數量,但效果就不如OpenAI。同期選手中,OpenAI對于語言模型的用心顯然是更多的。

一方面是資源投入,無論是越來越大的模型,需要消耗龐大的算力資源,ChatGPT所需要的高質量標注數據,依靠博士級別的專業人士來完成,比起將數據標注任務分發給眾包平臺,顯然會消耗更多的人力和財力。

另一方面,是技術投入,大規模預訓練、增強學習等技術都用在提升NLP對話系統在開放通用領域上的理解和推理能力。NLP是認知智能,要提升就必須解決知識依賴,而知識又是非常離散且難以表示的,要解決帶標數據不足、常識知識不足等問題,是非常具有技術挑戰的。多年前IBM的Frederick Jelinek就說過:“每當我開除一個語言學家,語音識別系統的性能就會改善一些?!鳖H有種“解決不了問題,就解決提出問題的人”的既視感。所以也可以說,OpenAI選擇了一條更難走的路,去解決真正困難的問題。

此外,聚焦NLP領域也意味著OpenAI會承擔隱形的機會成本。

今年AIGC(AI生成內容)在資本市場和應用市場都有很大的進展,與AI作畫、音視頻生成、AlphaFold2所解決的蛋白質結構預測等生成任務相比,NLP任務都是直接用詞匯和符號來表達概念,此類模型通過“API+云服務”來完成商業化服務,無論是云資源的消耗量還是接口調用服務收費,所獲得的收益也是遠不及圖像音視頻或科學計算的。拿同樣的精力做十個八個Dalle模型,肯定能賺得更多。

科技博主王詠剛在博客中分享了一個故事,稱與OpenAI的兩位聯合創始人交流,發現這二人甚至不知道AIGC是什么意思!

說到這里,或許可以得出結論,OpenAI作為一個旨在“實現安全的通用人工智能(AGI)”的公司,就是在不計投入、不計商業回報,專心致志地通過過預訓練大模型來提升NLP任務的各項指標,從而接近AGI的愿景。

為什么OpenAI能夠走出這條引領潮流的大模型差異化之路呢?

一方面是NLP的特殊之處。

NLP 不是魔術,但是,其結果有時幾乎就是魔術一般神奇。通用人工智能必須具備認知智能,這也是目前制約人工智能取得更大突破和更廣泛應用的關鍵瓶頸,而NLP正是認知智能的核心。Geoffrey Hinton、Yann LeCun都曾說過類似的觀點,深度學習的下一個大的進展,應該是讓神經網絡真正理解文檔的內容。

也就是說,當AI能理解自然語言了,AGI可能就實現了。

另外,OpenAI的運行模式也起到了關鍵的影響。

突破性創新早期需要大量的投入,大模型的開發需要大量的基礎設施投入,而ChatGPT的對話系統短期內很難靠調用量的規?;瘉頂偲窖邪l成本。因此,OpenAI是一個非營利性研究機構,沒有迫切的商業化壓力,因此可以更專注于NLP領域的基礎研究,這是商業型AI公司所很難實現的。

2011年,自然語言領域的泰斗肯尼斯·丘吉(Kenneth Church)發表了一篇長文《鐘擺擺得太遠》(A Pendulum Swung Too Far),其中提到:我們這一代學者趕上了經驗主義的黃金時代,把唾手可得的低枝果實采摘下來,留給下一代的都是“難啃的硬骨頭”。

深度學習是經驗主義的一個新高峰,而這個領域的低枝果實也總有摘完的一天,近年來有大量AI科學家發出警告,深度學習面臨很多局限性,單純用深度學習很難解決一些復雜任務,或許不用太久,基礎性突破就會成為AI產業的重要支撐。

GPT的演進也說明了,AI的突破需要循序漸進、從小到大地一步步實現,今天,每家AI企業和研究機構都在做大模型,相比CV計算機視覺、數字人、元宇宙等AI應用,NLP要顯得暗淡很多。而如果一窩蜂去摘容易的果實,最終會制約AI深入產業的腳步。

ChatGPT的出現提醒我們,唯有啃下基礎領域的硬骨頭,才能真正為AI帶來質變。

關鍵詞: chatgpt openai 人工智能 gpt-1

版權聲明:
    凡注明來網絡消費網的作品,版權均屬網絡消費網所有,未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明"來源:網絡消費網"。違反上述聲明者,本網將追究其相關法律責任。
    除來源署名為網絡消費網稿件外,其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
熱文

網站首頁 |網站簡介 | 關于我們 | 廣告業務 | 投稿信箱
 

Copyright © 2000-2020 www.fnsyft.com All Rights Reserved.
 

中國網絡消費網 版權所有 未經書面授權 不得復制或建立鏡像
 

聯系郵箱:920 891 263@qq.com

備案號:京ICP備2022016840號-15

營業執照公示信息

国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

        蜜桃91丨九色丨蝌蚪91桃色| 丁香婷婷综合色啪| 波多野结衣亚洲| 亚洲欧美日韩国产手机在线| 欧美日韩国产不卡| 日本一区二区动态图| 日本亚洲天堂网| 久久精品水蜜桃av综合天堂| 91福利社在线观看| 中文字幕乱码一区二区免费| 麻豆免费精品视频| 中文字幕不卡的av| 久久国产精品区| 国产精品久久久久久久久图文区 | 国产欧美久久久精品影院| 日韩精品一二三四| 国产日韩v精品一区二区| 欧美日韩一区成人| 亚洲三级免费观看| 成人福利电影精品一区二区在线观看 | 国产日韩欧美一区二区三区综合 | 色先锋资源久久综合| 中文字幕成人在线观看| 韩国女主播成人在线| 亚洲人成网站精品片在线观看| 日韩情涩欧美日韩视频| 午夜国产不卡在线观看视频| 久久婷婷国产综合国色天香| 欧美日韩午夜在线| 亚洲一区二区三区四区在线免费观看| thepron国产精品| 91官网在线观看| 亚洲免费观看视频| 91天堂素人约啪| 欧美日韩国产精品自在自线| 亚洲综合自拍偷拍| 国产偷国产偷亚洲高清人白洁| 欧美日韩精品一区二区天天拍小说 | 中文字幕一区二区在线播放| 欧美电影免费观看高清完整版在线观看| 亚洲综合男人的天堂| 91视视频在线直接观看在线看网页在线看| 在线观看视频一区| 亚洲国产精品综合小说图片区| 久久久精品影视| 欧美一级一级性生活免费录像| 日韩av一区二区三区四区| 最新国产成人在线观看| 久久精品夜色噜噜亚洲aⅴ| 国产精品一区2区| 色综合中文字幕国产| 国产精品成人免费在线| 99re66热这里只有精品3直播| 欧美日韩一区成人| 日本不卡一区二区三区高清视频| 中文字幕不卡在线| 久久精品一区二区三区不卡| 国产a久久麻豆| 国产成人综合在线| 91久久精品网| 午夜伊人狠狠久久| 亚洲天堂a在线| 国产精品美日韩| 久久综合九色综合97婷婷| 欧美一卡2卡三卡4卡5免费| 久久精品免费看| 午夜国产精品一区| 亚洲国产裸拍裸体视频在线观看乱了 | www.亚洲精品| 91精品国产欧美一区二区18 | 精品粉嫩aⅴ一区二区三区四区| 国产美女精品一区二区三区| 在线亚洲高清视频| 石原莉奈在线亚洲三区| 亚洲国产一区二区三区| 亚洲一区在线看| 亚洲女同ⅹxx女同tv| 亚洲蜜桃精久久久久久久| 欧美激情一区二区三区全黄| 久久久三级国产网站| 成人av网站在线| 日韩一区二区电影| 国产成人在线网站| 欧美一级理论性理论a| 国产精品一区二区91| 在线综合+亚洲+欧美中文字幕| 激情文学综合丁香| 欧美日韩一区二区三区高清| 久久国产精品第一页| 欧美色区777第一页| 精品一区二区三区香蕉蜜桃| 在线观看日韩国产| 久久电影网站中文字幕| 欧美日韩黄色影视| 国产激情精品久久久第一区二区| 制服丝袜国产精品| 国产成人精品一区二| 日韩视频在线观看一区二区| 风流少妇一区二区| 精品国产乱码久久久久久牛牛| eeuss鲁片一区二区三区在线观看| 欧美成人vr18sexvr| 91污在线观看| 国产日韩欧美在线一区| 中文字幕免费不卡在线| 亚洲免费在线视频| 亚洲综合色在线| 日本视频一区二区三区| 欧美亚洲动漫另类| 国产成人在线看| 久久女同互慰一区二区三区| 久久中文娱乐网| 国产精品灌醉下药二区| 亚洲欧美日韩一区二区三区在线观看| 亚洲最大的成人av| 一道本成人在线| 精品午夜一区二区三区在线观看 | 国产成人在线色| 久久亚洲欧美国产精品乐播| 国产欧美日韩久久| 亚洲精品v日韩精品| 五月激情丁香一区二区三区| 狠狠色丁香婷婷综合| 欧美不卡在线视频| 国产丝袜欧美中文另类| 亚洲精品国产成人久久av盗摄| 亚洲电影一区二区| 精品一区二区三区欧美| 日韩欧美美女一区二区三区| 久久久91精品国产一区二区三区| 亚洲精品视频免费观看| 麻豆精品国产传媒mv男同| 91精品国产一区二区三区蜜臀| 91色综合久久久久婷婷| 亚洲特级片在线| 五月激情丁香一区二区三区| 国产精品一二三在| 欧美高清在线精品一区| 亚洲永久免费视频| 国产一区二区导航在线播放| 久久久久久久综合日本| 中文字幕综合网| 美日韩黄色大片| 亚洲精品一区二区三区99 | 日韩美女视频一区| 色综合视频在线观看| 成人av电影在线| 亚洲日本在线天堂| 欧美性做爰猛烈叫床潮| 99精品久久久久久| 亚洲激情第一区| 欧美精品一卡二卡| 久久精品人人做人人爽人人| 亚洲大片免费看| 日韩一区二区影院| 亚洲欧洲三级电影| 精品一区二区三区不卡| 欧美国产一区二区| 婷婷国产v国产偷v亚洲高清| 成人动漫一区二区三区| 亚洲欧美激情插| 欧美日本国产一区| 日本一区二区在线不卡| 美女在线视频一区| 国产欧美精品区一区二区三区| 午夜电影一区二区| 91污片在线观看| 天堂成人国产精品一区| 亚洲精品在线观看网站| 一区二区三区美女| 成人性生交大片| 亚洲一区av在线| 精品国产麻豆免费人成网站| 亚洲蜜桃精久久久久久久| 国产伦精品一区二区三区在线观看| 中文字幕在线不卡国产视频| 欧美视频一区二区三区四区| 国产午夜精品久久| 麻豆精品久久精品色综合| 国产精品系列在线| 欧美日韩一区二区在线观看 | 91老师片黄在线观看| 天堂久久一区二区三区| 久久久精品综合| 在线视频欧美精品| 亚洲国产电影在线观看| 国产专区欧美精品| 亚洲精品中文字幕乱码三区 | 欧美日韩高清一区二区| 中文字幕日韩欧美一区二区三区| 国产综合色视频| 一区二区三区国产精华| 精品国产一区二区三区久久影院| 午夜精品福利久久久| 国产免费观看久久| 国产精品12区| 婷婷一区二区三区| 国产精品视频一二三| 7777精品伊人久久久大香线蕉经典版下载| 亚洲少妇最新在线视频|