網(wǎng)絡(luò)消費網(wǎng) >  科技 > > 正文
        動態(tài)焦點:Meta大模型成了“科學造假發(fā)動機”
        時間:2022-11-18 21:08:39

        Meta最新大模型差點成了“科研造假發(fā)動機”,剛出3天就在爭議中下架。

        1200億參數(shù)語言模型Galactica,在4800萬篇學術(shù)論文和各式教科書、百科等數(shù)據(jù)上訓練而來。


        (資料圖)

        (與太空堡壘卡拉狄加同名)

        其本意是想解決學術(shù)界信息過載,幫助研究人員做信息梳理、知識推理和寫作輔助,一度被認為是“科研者的福音”,或者“寫論文的Copilot”

        But,一經(jīng)開放使用,很快就被網(wǎng)友們發(fā)現(xiàn)了大問題。

        它確實能為自己生成的內(nèi)容引用文獻,但有時這個文獻并不存在,作者卻是真實存在的人

        它能生成看起來像模像樣的科普文字,但內(nèi)容卻是完全錯誤的

        真空中的光速和聲速接近可還行?

        著名的Gary·AI悲觀主義者·Marcus也來吐槽,Galactica把他的出生日期、教育經(jīng)歷和研究領(lǐng)域等信息全搞錯了。

        對以上種種問題,馬克斯普朗克智能系統(tǒng)研究所所長Michael Black總結(jié)道:

        這將開啟一個科學深度造假(deep scientific fakes)的時代。

        會出現(xiàn)研究者從未寫過的虛假論文,這些論文隨后會被其他真實的論文引用,簡直亂套了。

        雖然他也注意到,Galactica的開發(fā)者在每個輸出內(nèi)容后都加了“內(nèi)容可能不可靠”的警告,但“潘多拉的魔盒一旦開啟,就關(guān)不上了”。

        事實上他的擔憂不無道理,AI生成內(nèi)容的速度要比人類快的多,一旦大量被搜索引擎抓取就有可能出現(xiàn)在前排,甚至被當成正確答案展示在最上面,誤導更多人。

        這樣的爭議持續(xù)了兩三天,團隊只好無奈宣布Demo暫時下架,論文和源代碼繼續(xù)開放給相關(guān)領(lǐng)域研究者。

        作為Meta首席科學家,LeCun對這個局面并不滿意。

        與他觀點一致的網(wǎng)友認為,Galactica是有幫助且有趣的,只是被個別人濫用了。

        本意是好的

        Galactica由Meta AI與Papers with Code合作開發(fā)。

        在論文引言部分,團隊寫到:

        2022年5月,arXiv上每天平均新增516篇論文……科學數(shù)據(jù)的增長速度更是比人們的處理能力快……一個人已經(jīng)不可能讀完特定研究領(lǐng)域的論文。

        搜索引擎不直接組織信息,維基百科這樣的形式需要人力來維護,研究人員持續(xù)為信息過載感到不知所措。

        因此他們提出,語言大模型可以更好的存儲、組合和推理科學知識,并提出一個終極愿景:

        神經(jīng)網(wǎng)絡(luò)將成為科學研究的下一代人機界面,就從這篇論文開始。

        本意是好的,而且Galactica的表現(xiàn)也確實不錯。

        除了文本、數(shù)學公式、代碼任務(wù)之外,它還可以執(zhí)行化學式、蛋白質(zhì)序列等多模態(tài)任務(wù)。

        Galactica 1200億參數(shù)版本在許多科學類任務(wù)上性能超越OpenAI的GPT-3、DeepMin的Chinchilla與Gopher、以及開源的BLOOM。

        然鵝,測試基準畢竟是死的,一旦進入生產(chǎn)環(huán)境開放給用戶,還是會出現(xiàn)開發(fā)時預料不到的情況。

        問題出在哪?

        在Hacker News上有人認為,語言模型終究是在“對語言建模”而不是對內(nèi)容。

        就像AI繪畫模型一樣,你讓它畫“騎馬的宇航員”它就能畫出來,雖然這不太可能發(fā)生,但是很有趣。

        類似的討論也發(fā)生在Twitter上。如果你讓AI生成一篇關(guān)于“生活在太空的熊”的維基頁面,AI也會試著生成。

        有人認為,不,AI需要判斷出這個要求不合理。

        關(guān)鍵就在于,人們對圖片和文字的要求是不一樣的。

        圖片中的內(nèi)容不合理,人們只會覺得有趣而接受。而文字的內(nèi)容錯了,那就不可接受。

        LeCun則認為這種工具的用法應(yīng)該是輔助駕駛,它不會幫你寫好論文,只是幫你在過程中減輕認知負擔。

        以谷歌為代表的AI大廠,近年來對大模型特別是生成式模型的發(fā)布非常謹慎,像是對話模型LaMDA和AI繪畫Imagen等都不開源、不給Demo或只給限定場景下的Demo。

        另一方面,以Stable Diffusion為代表開源項目推動了整個領(lǐng)域的技術(shù)進步與應(yīng)用普及,但也在版權(quán)和生成有害內(nèi)容方面引發(fā)一些問題。

        你更支持哪種做法?或者還有第三條路么?

        關(guān)鍵詞: galactica meta

        版權(quán)聲明:
            凡注明來網(wǎng)絡(luò)消費網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責任。
            除來源署名為網(wǎng)絡(luò)消費網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
        熱文

        網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
         

        Copyright © 2000-2020 www.fnsyft.com All Rights Reserved.
         

        中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復制或建立鏡像
         

        聯(lián)系郵箱:920 891 263@qq.com

        備案號:京ICP備2022016840號-15

        營業(yè)執(zhí)照公示信息

        亚洲成AV人片在线观看| 亚洲乱码一二三四五六区| 中文字幕亚洲男人的天堂网络| 亚洲狠狠狠一区二区三区| 自怕偷自怕亚洲精品| 蜜芽亚洲av无码精品色午夜| 亚洲一卡2卡三卡4卡有限公司 | 久久香蕉国产线看观看亚洲片| 亚洲午夜久久久久妓女影院| 亚洲中文字幕无码中文字在线| 成人午夜亚洲精品无码网站| 亚洲一区AV无码少妇电影☆| 国产亚洲欧洲精品| 亚洲国产精品无码久久久蜜芽| 亚洲av永久无码精品秋霞电影影院| 日本亚洲欧洲免费天堂午夜看片女人员 | 91精品国产亚洲爽啪在线影院| 夜夜亚洲天天久久| 亚洲理论片中文字幕电影| 亚洲一级毛片视频| 亚洲精品无码久久久久秋霞| 久久亚洲中文无码咪咪爱| 亚洲国产免费综合| 亚洲精品午夜国产VA久久成人| 久久亚洲精品成人777大小说| 99久久精品国产亚洲| 亚洲人成日本在线观看| 亚洲国产熟亚洲女视频| 亚洲aⅴ天堂av天堂无码麻豆| 亚洲国产av一区二区三区| 国产亚洲精品无码专区| 亚洲成AV人片在线播放无码| 亚洲色欲www综合网| 亚洲精品人成网在线播放影院| 亚洲第一成年免费网站| 亚洲欧洲日产国码高潮αv| 亚洲男同帅GAY片在线观看| 久久精品国产亚洲AV无码麻豆| 亚洲AV无码久久久久网站蜜桃| 亚洲av无码日韩av无码网站冲| 亚洲国产成人五月综合网 |