透過ChatGPT的進化足跡，OpenAI傳達了哪些信號？

時間：2022-12-14 20:56:57

古希臘神話中，一位名叫赫爾墨斯的神，會充當人神之間的信使，穿著帶有雙翼的飛鞋，行走在神明與人類之間。

根據《荷馬史詩》的記載：“在天神中，赫爾墨斯是最喜歡引導凡人前行的?！边@句話用來形容OpenAI與AI的關系，雖不中亦不遠矣。

(資料圖)

上一周，OpenAI打造的ChatGPT出盡風頭，成為國內外AI領域的頭號熱門話題。關于ChatGPT的對話能力，大家可能已經通過很多文章感受過了。簡單總結，就是對答如流，無所不能，可替程序員寫代碼，可替商務人士出方案，還能替作家編故事。一度讓久違的 “谷歌已死”“XX職業又要被AI取代了”之類的AI威脅論說辭，開始大量出現了。

關于ChatGPT的神奇之處，看多了也有點審美疲勞了，冷靜下來思考一下：

為什么同樣是AIGC，問答、對話這類NLP領域應用更容易引起轟動，激發人們對通用人工智能的希望？

為什么同樣是預訓練模型，相比BERT、GPT3等前輩，ChatGPT的對話能力產生了質的飛躍？

為什么同樣是做AI，OpenAI要死磕NLP，從GPT1到 ChatGPT不斷迭代？

OpenAI的CEO、聯合創始人 Sam Altman曾說過一句話：“Trust the exponential，Flat looking backwards，vertical looking forwards”，相信指數的力量，平行地向后看，垂直地向前看。ChatGPT出現代表著，AI似乎已經站到了指數級飛躍的關鍵點上。但起飛的ChatGPT，并不是一蹴而就的。

從GPT到ChatGPT，恰好代表了OpenAI在大模型領域切實走過的歷程，從中可以看到，OpenAI在AI大模型競爭中，已經探索出了一條屬于自己的道路，就如同赫爾墨斯一樣，成為引領AI技術前進的使者。

如果OpenAI是傳遞AI前沿進展的赫爾墨斯，ChatGPT就是那雙帶著雙翼的金絲鞋。我們既要關注ChatGPT這雙鞋究竟有多神奇，更有必要搞懂，OpenAI選擇的這條大模型道路有何玄機。

今天，中國科技企業與研究機構都在積極投布局大模型，求術不如問道，我們不妨從GPT這一系列模型的演變歷程，望向OpenAI關于AI與大模型的戰略思考與發展脈絡。

從GPT-1到ChatGPT，超神模型的演化足跡

OpenAI在博客中寫道，ChatGPT 是從 GPT3.5 系列中的模型進行微調而誕生的。

正如名稱中所暗示的那樣，GPT- 3.5是OpenAI設計的一系列NLP模型中的第四個，此前還出現了GPT - 1、GPT - 2 和 GPT - 3。

在 GPT 出現之前，NLP 模型主要是基于針對特定任務的大量標注數據進行訓練。這會導致一些限制：

大規模高質量的標注數據不易獲得；

模型僅限于所接受的訓練，泛化能力不足；

無法執行開箱即用的任務，限制了模型的落地應用。

為了克服這些問題，OpenAI走上了預訓練大模型的道路。從GPT1到ChatGPT，就是一個預訓練模型越來越大、效果越來越強的過程。當然，OpenAI的實現方式并不只是“大力出奇跡”那么簡單。

第一代：從有監督到無監督GPT-1。2018年，OpenAI推出了第一代生成式預訓練模型GPT-1，此前，NLP任務需要通過大規模數據集來進行有監督的學習，需要成本高昂的數據標注工作，GPT-1的關鍵特征是：半監督學習。先用無監督學習的預訓練，在 8 個 GPU 上花費了1 個月的時間，從大量未標注數據中增強AI系統的語言能力，獲得大量知識，然后進行有監督的微調，與大型數據集集成來提高系統在NLP任務中的性能。

GPT-1的效果明顯，只需要極少的微調，就可以增強NLP模型的能力，減少對資源和數據的需求。同時，GPT-1也存在明顯的問題，一是數據局限性，GPT-1 是在互聯網上的書籍和文本上訓練的，對世界的認識不夠完整和準確；二是泛化性依然不足，在一些任務上性能表現就會下降。

第二代：更大更高更強的GPT-2。2019年推出的GPT-2，與GPT-1并沒有本質上的不同（注意這一點），架構相同，使用了更大的數據集WebText，大約有40 GB的文本數據、800萬個文檔，并為模型添加了更多參數（達到驚人的 15 億個參數），來提高模型的準確性，可以說是加強版或臃腫版的GPT-1。

GPT-2的出現，進一步證明了無監督學習的價值，以及預訓練模型在下游NLP任務中的廣泛成功，已經開始達到圖靈測試的要求，有研究表示，GPT-2生成的文本幾乎與《紐約時報》的真實文章（83%）一樣令人信服。

（GPT-2表現）

第三代：跨越式進步的GPT-3。2020年，GPT-3的這次迭代，出現了重大的飛躍，成為與GPT-2迥然不同的物種。

首先，GPT-3的體量空前龐大，擁有超過 1750 億個參數，是GPT-2的 117 倍；其次，GPT-3不需要微調，它可以識別到數據中隱藏的含義，并運用此前訓練獲得的知識，來執行下游任務。這意味著，哪怕從來沒有接觸過的示例，GPT-3就能理解并提供不錯的表現。因此，GPT-3也在商業應用上表現出了極高的穩定性和實用性，通過云上的 API訪問來實現商業化。這種入得了實驗室、下得了車間的能力，使得GPT-3成為2020年AI領域最驚艷的模型之一。

當然，GPT-3也并不完美。正如聯合創始人 Sam Altman所說，GPT-3的水平仍處于早期階段，有時候也會犯非常愚蠢的錯誤，我們距離真正的人工智能世界還有很長的距離。另外，GPT-3 API 的很多基礎模型非常龐大，需要大量的專業知識和性能優異的機器，這使得中小企業或個人開發者使用起來比較困難。

第四代：基于理解而生成的ChatGPT。終于在2022年，OpenAI的預訓練語言模型之路，又出現了顛覆式的迭代，產生了技術路線上的又一次方向性變化：基于人工標注數據+強化學習的推理和生成。

前面提到，一開始預訓練模型的出現，是為了減少監督學習對高質量標注數據的依賴。而ChatGPT在GPT -3.5大規模語言模型的基礎上，又開始依托大量人工標注數據（據說OpenAI找了40個博士來標數據），這怎么又走回監督學習的“老路”了呢？

原因是，GPT 3.5雖然很強，但無法理解人類指令的含義（比如寫一段博文、改一段代碼），無法判斷輸入，自然也就很難給出高質量的輸出答案。所以OpenAI通過專業的標注人員（據說是40個博士）來寫詞條，給出相應指令/問題的高質量答案，在基于這些數據來調整GPT -3.5的參數，從而讓GPT -3.5具備了理解人類指令的能力。

在人工標注訓練數據的基礎上，再使用強化學習來增強預訓練模型的能力。強化學習，簡單理解就是做對了獎勵、做錯了懲罰，不斷根據系統的打分來更新參數，從而產生越來越高質量的回答。所以這幾天很多人在互動中發現，ChatGPT會承認錯誤、會修改自己的答復，這正是因為它具備從人類的反饋中強化學習并重新思考的能力。

因為ChatGPT具備了理解能力，所以才被看作是通向通用人工智能AGI的路徑。

當然，ChatGPT也并不是完美進化體。OpenAI的官網明確提示，ChatGPT“可能偶爾會生成不正確的信息”，并且“對2021年之后的世界和事件的了解有限”。一些比較難的知識，比如“紅樓夢講了什么”，ChatGPT會一本正經地胡說八道。

從GPT模型的演進和迭代中，可以看到OpenAI是不斷朝著自然語言理解這一目標前進，用更大的模型、更先進的架構，最終為通用人工智能找到了一條路徑。

從GPT-1到ChatGPT的縱向演變，會看到OpenAI對大模型的獨特理解與技術脈絡——通過模型預訓練提升NLP指標，抵達強人工智能。NLP領域究竟特殊在哪里，值得OpenAI如此執著？

OpenAI的大模型差異化之路

前文中不難看出，OpenAI對于文本生成模型的執著，因為做夠得久、投入夠多，所以能夠做得更好，是非常有長期戰略定力的。

與之相比，和GPT-1同年推出的預訓練模型，還有谷歌發布的BERT，但后者在火爆一段時間之后影響力明顯減弱；而NLP問答領域一向由Meta引領，Meta AI 的 OPT 模型和GPT-3 達到了同等的參數量，但效果就不如OpenAI。同期選手中，OpenAI對于語言模型的用心顯然是更多的。

一方面是資源投入，無論是越來越大的模型，需要消耗龐大的算力資源，ChatGPT所需要的高質量標注數據，依靠博士級別的專業人士來完成，比起將數據標注任務分發給眾包平臺，顯然會消耗更多的人力和財力。

另一方面，是技術投入，大規模預訓練、增強學習等技術都用在提升NLP對話系統在開放通用領域上的理解和推理能力。NLP是認知智能，要提升就必須解決知識依賴，而知識又是非常離散且難以表示的，要解決帶標數據不足、常識知識不足等問題，是非常具有技術挑戰的。多年前IBM的Frederick Jelinek就說過：“每當我開除一個語言學家，語音識別系統的性能就會改善一些?！鳖H有種“解決不了問題，就解決提出問題的人”的既視感。所以也可以說，OpenAI選擇了一條更難走的路，去解決真正困難的問題。

此外，聚焦NLP領域也意味著OpenAI會承擔隱形的機會成本。

今年AIGC（AI生成內容）在資本市場和應用市場都有很大的進展，與AI作畫、音視頻生成、AlphaFold2所解決的蛋白質結構預測等生成任務相比，NLP任務都是直接用詞匯和符號來表達概念，此類模型通過“API+云服務”來完成商業化服務，無論是云資源的消耗量還是接口調用服務收費，所獲得的收益也是遠不及圖像音視頻或科學計算的。拿同樣的精力做十個八個Dalle模型，肯定能賺得更多。

科技博主王詠剛在博客中分享了一個故事，稱與OpenAI的兩位聯合創始人交流，發現這二人甚至不知道AIGC是什么意思！

說到這里，或許可以得出結論，OpenAI作為一個旨在“實現安全的通用人工智能(AGI)”的公司，就是在不計投入、不計商業回報，專心致志地通過過預訓練大模型來提升NLP任務的各項指標，從而接近AGI的愿景。

為什么OpenAI能夠走出這條引領潮流的大模型差異化之路呢？

一方面是NLP的特殊之處。

NLP 不是魔術，但是，其結果有時幾乎就是魔術一般神奇。通用人工智能必須具備認知智能，這也是目前制約人工智能取得更大突破和更廣泛應用的關鍵瓶頸，而NLP正是認知智能的核心。Geoffrey Hinton、Yann LeCun都曾說過類似的觀點，深度學習的下一個大的進展，應該是讓神經網絡真正理解文檔的內容。

也就是說，當AI能理解自然語言了，AGI可能就實現了。

另外，OpenAI的運行模式也起到了關鍵的影響。

突破性創新早期需要大量的投入，大模型的開發需要大量的基礎設施投入，而ChatGPT的對話系統短期內很難靠調用量的規?；瘉頂偲窖邪l成本。因此，OpenAI是一個非營利性研究機構，沒有迫切的商業化壓力，因此可以更專注于NLP領域的基礎研究，這是商業型AI公司所很難實現的。

2011年，自然語言領域的泰斗肯尼斯·丘吉(Kenneth Church)發表了一篇長文《鐘擺擺得太遠》(A Pendulum Swung Too Far)，其中提到：我們這一代學者趕上了經驗主義的黃金時代，把唾手可得的低枝果實采摘下來，留給下一代的都是“難啃的硬骨頭”。

深度學習是經驗主義的一個新高峰，而這個領域的低枝果實也總有摘完的一天，近年來有大量AI科學家發出警告，深度學習面臨很多局限性，單純用深度學習很難解決一些復雜任務，或許不用太久，基礎性突破就會成為AI產業的重要支撐。

GPT的演進也說明了，AI的突破需要循序漸進、從小到大地一步步實現，今天，每家AI企業和研究機構都在做大模型，相比CV計算機視覺、數字人、元宇宙等AI應用，NLP要顯得暗淡很多。而如果一窩蜂去摘容易的果實，最終會制約AI深入產業的腳步。

ChatGPT的出現提醒我們，唯有啃下基礎領域的硬骨頭，才能真正為AI帶來質變。

關鍵詞： chatgpt openai 人工智能 gpt-1

延伸閱讀:

火速變現微軟開始在ChatGPT聊天中插廣告 2023-03-30
全球播報:美參議員反對封禁TikTok：不喜歡別用憲法沒有賦予封禁權 2023-03-30
一枚超2億元的腕表背后：“表王”百達翡麗的危機 2023-03-29
環球看點！3億個工作將被ChatGPT取代更要擔心的卻不是失業 2023-03-29
當前聚焦：賽博難民打響反AI第一槍 2023-03-29
天天實時：誰在取代老干媽？ 2023-03-29
天天新資訊：你現在聽的歌很可能是AI唱的 2023-03-29
每日速看!快手CEO程一笑：生成式AI與業務場景融合價值潛力大 2023-03-29

版權聲明：
凡注明來網絡消費網的作品，版權均屬網絡消費網所有，未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明"來源：網絡消費網"。違反上述聲明者，本網將追究其相關法律責任。
除來源署名為網絡消費網稿件外，其他所轉載內容之原創性、真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實。

熱文

學好語文就選科大訊飛AI翻譯筆，多重使...
三個月內突圍而出，TVB識貨618告捷: GM...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
環球報道:[今日關注] 南昌男科醫院男科...
環球報道:[今日關注] 南昌男科醫院男科...
錦繡良緣
vivo手機屏下的按鍵突然沒了怎么辦|天天...
vivo手機屏下的按鍵突然沒了怎么辦|天天...
證監會立案！此前剛遭上交所紀律處分！-...
證監會立案！此前剛遭上交所紀律處分！-...
志愿者化身“移動拐杖”：端午假期鐵路...
畫面溫馨！約60只海豚在海警艦艇附近跳...
畫面溫馨！約60只海豚在海警艦艇附近跳...
深圳中國國際旅行社有限公司（關于深圳...
深圳中國國際旅行社有限公司（關于深圳...
天天即時：欠了信用卡1萬如何申請延長分期
共話中國經濟新機遇丨綜述：中荷經貿人...
共話中國經濟新機遇丨綜述：中荷經貿人...
基金分紅：方正富邦穩豐一年定開債券發...
基金分紅：方正富邦穩豐一年定開債券發...
樹欲靜風而不止的意思_樹欲靜風不止什么...
樹欲靜風而不止的意思_樹欲靜風不止什么...
手扶梯_關于手扶梯的介紹
天天觀點：京津冀及山東多地超過40℃ 1...
天天觀點：京津冀及山東多地超過40℃ 1...
當前速看：大摩：維持MP Materials(MP.US)評級
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
長城MV | 團結，就是力量！
世界滾動:鎮江中國獨角獸企業數量全國排...
世界滾動:鎮江中國獨角獸企業數量全國排...
世界播報:新疆挖掘南疆特色產業潛力
世界播報:新疆挖掘南疆特色產業潛力
欠了信用卡11年沒還，不還產生什么后果_...
欠了信用卡11年沒還，不還產生什么后果_...
天天精選！小區便利店怎么選擇位置
我的世界自動門感應門（我的世界自動感...
我的世界自動門感應門（我的世界自動感...
她曾經在23歲時走紅，卻被身高限制戲路...
她曾經在23歲時走紅，卻被身高限制戲路...
最新消息：老年人有性生活就是不害臊？...
羊湯怎么熬好喝? 快資訊
羊湯怎么熬好喝? 快資訊
如果你是說話容易緊張，還很自卑的人，...
如果你是說話容易緊張，還很自卑的人，...
焦點快播：美媒：失蹤潛艇副駕駛妻子是...
頭條焦點：離婚二審撫養權怎么判
頭條焦點：離婚二審撫養權怎么判
世界最新：杭州民辦東方中學教師待遇_杭...
世界最新：杭州民辦東方中學教師待遇_杭...
【天天播資訊】國際油價21日上漲天天觀天下
五彩繩原來是織女留下來的線基本情況講解
五彩繩原來是織女留下來的線基本情況講解
環球速讀：瘋狂！散戶大買15億，美股空...
環球速讀：瘋狂！散戶大買15億，美股空...
世界動態:首屆京津冀生態產業創新發展大...
世界報道:運動員該如何應對“飯圈文化”...
世界報道:運動員該如何應對“飯圈文化”...
“盛夏”（113） | 上游主題攝影征稿...
“盛夏”（113） | 上游主題攝影征稿...
港交所紐約辦事處開幕　提升北美地區服務
港交所紐約辦事處開幕　提升北美地區服務
韓媒：韓國環境部已批準“薩德”基地環...
看圖學習｜中華優秀傳統文化是中華民族...
看圖學習｜中華優秀傳統文化是中華民族...
當前觀察：郴電國際郴州分公司營業班獲...
當前觀察：郴電國際郴州分公司營業班獲...
天天新動態：三亞22日10時起發放一批旅...
呂梁市“三夏”麥收安排調度會要求：顆...
呂梁市“三夏”麥收安排調度會要求：顆...
比砒霜毒百倍！一顆就能致命！千萬別碰...
比砒霜毒百倍！一顆就能致命！千萬別碰...
全球要聞：光明日報刊文:為什么印度難以...
全球要聞：光明日報刊文:為什么印度難以...
紀檢監察機關統籌用好基層監督力量精...
紀檢監察機關統籌用好基層監督力量精...
總投資約36億元，惠州新材料產業園再引5...
觀焦點：魍魎魑魅怎么讀什么意思？它...
選流量卡如何避坑？這三步曲你都了解了嗎？
選流量卡如何避坑？這三步曲你都了解了嗎？
俠探杰克第一季豆瓣（影評下午茶之俠探...
俠探杰克第一季豆瓣（影評下午茶之俠探...
將于7月內上市新款榮威i5官圖發布
淘寶林彎彎是誰_林彎彎淘寶店
淘寶林彎彎是誰_林彎彎淘寶店
【天天播資訊】琿春市積極構建和諧勞動...
【天天播資訊】琿春市積極構建和諧勞動...
三終端上人難，邀約棘手。
GDR發行熱度持續上升多家龍頭企業扎堆...
GDR發行熱度持續上升多家龍頭企業扎堆...
國寶“體驗”端午文化當前焦點
國寶“體驗”端午文化當前焦點
【環球報資訊】OPPO A57打開飛行模式方法介紹
近親屬和親屬的區別_近親屬|當前看點
近親屬和親屬的區別_近親屬|當前看點
當前視訊！二建報名時間2021年_2021年二...
當前視訊！二建報名時間2021年_2021年二...
焦點熱訊:華中科技大學地址在哪個城市_...

科技

· 2023最建議買的二手手機推薦？2023最建議買
· 為什么懂手機的人都不用華為？為什么很多人
· 華為oppo手機同等價位哪個好？三千左右買華
· oppo和華為誰用久了可以不卡？oppo手機好還
· oppo萬能密碼6位數解鎖是什么？OPPO手機的
· 如何打開oppo手機鎖屏密碼？oppo手機密碼鎖
· OPPO手機怎么總是自己跳轉快應用？OPPO打開
· oppo手機像中毒似的彈出廣告？oppo手機老是
· oppo手機熱點資訊如何徹底關掉？oppo手機老
· oppo手機開發者選項在哪里能打開？oppo手機

熱文

環球報道:[今日關注] 南昌男科醫院男科收費高嗎排名公開
證監會立案！此前剛遭上交所紀律處分！-觀焦點
深圳中國國際旅行社有限公司（關于深圳中國國際旅行社有限公司介紹）|報道
基金分紅：方正富邦穩豐一年定開債券發起基金6月27日分紅
樹欲靜風而不止的意思_樹欲靜風不止什么意思是什么
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一筐粽子：想讓家人過上好日子-全球速看料
世界播報:新疆挖掘南疆特色產業潛力
欠了信用卡11年沒還，不還產生什么后果_全球最資訊
她曾經在23歲時走紅，卻被身高限制戲路，老公也是優秀的演員！|每日熱文

国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

科技

熱文