AI字幕在兒童頻道里吐“臟話”？中招比例高達40% 亞馬遜谷歌都很祖安

來源：鳳凰網

時間：2022-02-27 14:27:42

AI自動生成的字幕，能離譜到什么程度？

不僅把“螃蟹”（crab）誤聽成“廢話”（crap），當場爆粗：

甚至還能把“玉米”（corn）給翻譯成p*rn……

關鍵在于，這些是AI給兒童節(jié)目自動生成的字幕。

被AAAI 2022收錄的一篇新研究發(fā)現，在7013個兒童視頻中，接近40%的節(jié)目出現了少兒不宜或臟話等詞匯。

甚至在一個113集的兒童機器人學習欄目中，AI就“爆粗”了103次，平均接近一集一次！

對此，油管（YouTube）在接受《連線》采訪時回應：

我們?yōu)?3歲以下的兒童開發(fā)了YouTube Kids，這個APP會關閉字幕生成功能。

但如果真有字幕需求的話，如何才能想辦法減少這種AI生成錯誤？

一起來看看。

亞馬遜谷歌都很“祖安”

先來看看這篇論文的調查結果。

研究人員一共從油管上選出了24個兒童頻道，分別記錄了這些頻道的播放量和訂閱量。

可以看出，這些篩選出來的視頻播放量基本都達到了百萬級，訂閱人數也同樣不少。

然后，研究人員分別試了一下谷歌和AWS（亞馬遜網頁服務）的字幕生成效果。

結果顯示，AI字幕的“少兒不宜”率可謂離譜：

在7013個視頻中，谷歌AI出現錯誤字幕的次數達到2768次，接近40%。

亞馬遜的AI字幕錯誤率還要更高，達到了3672次，超過52%。

具體來說，兩個AI分別容易在這些“不太恰當”的字詞上出錯：

圖左亞馬遜，圖右谷歌

在這些數據集中，有一些詞語又尤為“少兒不宜”，例如一些罵人的臟詞：

經過作者們人工檢查（例如確認原視頻是否真的說了臟話），發(fā)現AI主要容易在以下幾種情況中出錯：

背景音樂嘈雜

說話者為嬰兒

說話者為兒童

說話者以英語為第二語言

說話者在唱歌

包括但不限于這些情況

那么，有沒有什么辦法減少這種情況發(fā)生呢？

語序連貫的錯誤更容易修復

研究人員提出了一個新的數據集，利用近音字詞來構建禁忌詞的“替換”備選。

例如，對于crap這一可能出現的“粗口”，研究人員就給它設置了crab、craft等讀音相似的字詞，便于AI在搞錯時進行替換。

具體來說，他們在BERT、XLM、XLNet等NLP模型上，針對“完形填空”任務進行了重新訓練，也就是用[MASK]遮住部分單詞，讓AI來填寫對應的內容。

結果顯示，在語序正常、前后文案有邏輯的視頻中，AI替換的準確率更高（藍色為正確替換詞）：

然而在一些邏輯不強的文案中，成功替換的效果就沒有那么好了：

最終，Megatron和Levenshtein等模型展現出了最好的修復效果，分別給亞馬遜AI帶來了超過25%的正確修復率，給谷歌AI帶來了超過28%的修復率。

看來AI在字幕生成能力上還是任重道遠啊。

關鍵詞：

延伸閱讀:

火速變現微軟開始在ChatGPT聊天中插廣告 2023-03-30
全球播報:美參議員反對封禁TikTok：不喜歡別用憲法沒有賦予封禁權 2023-03-30
一枚超2億元的腕表背后：“表王”百達翡麗的危機 2023-03-29
環(huán)球看點！3億個工作將被ChatGPT取代更要擔心的卻不是失業(yè) 2023-03-29
當前聚焦：賽博難民打響反AI第一槍 2023-03-29
天天實時：誰在取代老干媽？ 2023-03-29
天天新資訊：你現在聽的歌很可能是AI唱的 2023-03-29
每日速看!快手CEO程一笑：生成式AI與業(yè)務場景融合價值潛力大 2023-03-29

版權聲明：
凡注明來網絡消費網的作品，版權均屬網絡消費網所有，未經授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的，應在授權范圍內使用，并注明"來源：網絡消費網"。違反上述聲明者，本網將追究其相關法律責任。
除來源署名為網絡消費網稿件外，其他所轉載內容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考并自行核實。

熱文

學好語文就選科大訊飛AI翻譯筆，多重使...
三個月內突圍而出，TVB識貨618告捷: GM...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
玩轉穗澳特色就在琶洲！2023澳門·廣州...
環(huán)球報道:[今日關注] 南昌男科醫(yī)院男科...
環(huán)球報道:[今日關注] 南昌男科醫(yī)院男科...
錦繡良緣
vivo手機屏下的按鍵突然沒了怎么辦|天天...
vivo手機屏下的按鍵突然沒了怎么辦|天天...
證監(jiān)會立案！此前剛遭上交所紀律處分！-...
證監(jiān)會立案！此前剛遭上交所紀律處分！-...
志愿者化身“移動拐杖”：端午假期鐵路...
畫面溫馨！約60只海豚在海警艦艇附近跳...
畫面溫馨！約60只海豚在海警艦艇附近跳...
深圳中國國際旅行社有限公司（關于深圳...
深圳中國國際旅行社有限公司（關于深圳...
天天即時：欠了信用卡1萬如何申請延長分期
共話中國經濟新機遇丨綜述：中荷經貿人...
共話中國經濟新機遇丨綜述：中荷經貿人...
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)...
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)...
樹欲靜風而不止的意思_樹欲靜風不止什么...
樹欲靜風而不止的意思_樹欲靜風不止什么...
手扶梯_關于手扶梯的介紹
天天觀點：京津冀及山東多地超過40℃ 1...
天天觀點：京津冀及山東多地超過40℃ 1...
當前速看：大摩：維持MP Materials(MP.US)評級
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
獨臂背山工穿梭懸崖絕壁，運125斤重的一...
長城MV | 團結，就是力量！
世界滾動:鎮(zhèn)江中國獨角獸企業(yè)數量全國排...
世界滾動:鎮(zhèn)江中國獨角獸企業(yè)數量全國排...
世界播報:新疆挖掘南疆特色產業(yè)潛力
世界播報:新疆挖掘南疆特色產業(yè)潛力
欠了信用卡11年沒還，不還產生什么后果_...
欠了信用卡11年沒還，不還產生什么后果_...
天天精選！小區(qū)便利店怎么選擇位置
我的世界自動門感應門（我的世界自動感...
我的世界自動門感應門（我的世界自動感...
她曾經在23歲時走紅，卻被身高限制戲路...
她曾經在23歲時走紅，卻被身高限制戲路...
最新消息：老年人有性生活就是不害臊？...
羊湯怎么熬好喝? 快資訊
羊湯怎么熬好喝? 快資訊
如果你是說話容易緊張，還很自卑的人，...
如果你是說話容易緊張，還很自卑的人，...
焦點快播：美媒：失蹤潛艇副駕駛妻子是...
頭條焦點：離婚二審撫養(yǎng)權怎么判
頭條焦點：離婚二審撫養(yǎng)權怎么判
世界最新：杭州民辦東方中學教師待遇_杭...
世界最新：杭州民辦東方中學教師待遇_杭...
【天天播資訊】國際油價21日上漲天天觀天下
五彩繩原來是織女留下來的線基本情況講解
五彩繩原來是織女留下來的線基本情況講解
環(huán)球速讀：瘋狂！散戶大買15億，美股空...
環(huán)球速讀：瘋狂！散戶大買15億，美股空...
世界動態(tài):首屆京津冀生態(tài)產業(yè)創(chuàng)新發(fā)展大...
世界報道:運動員該如何應對“飯圈文化”...
世界報道:運動員該如何應對“飯圈文化”...
“盛夏”（113） | 上游主題攝影征稿...
“盛夏”（113） | 上游主題攝影征稿...
港交所紐約辦事處開幕　提升北美地區(qū)服務
港交所紐約辦事處開幕　提升北美地區(qū)服務
韓媒：韓國環(huán)境部已批準“薩德”基地環(huán)...
看圖學習｜中華優(yōu)秀傳統(tǒng)文化是中華民族...
看圖學習｜中華優(yōu)秀傳統(tǒng)文化是中華民族...
當前觀察：郴電國際郴州分公司營業(yè)班獲...
當前觀察：郴電國際郴州分公司營業(yè)班獲...
天天新動態(tài)：三亞22日10時起發(fā)放一批旅...
呂梁市“三夏”麥收安排調度會要求：顆...
呂梁市“三夏”麥收安排調度會要求：顆...
比砒霜毒百倍！一顆就能致命！千萬別碰...
比砒霜毒百倍！一顆就能致命！千萬別碰...
全球要聞：光明日報刊文:為什么印度難以...
全球要聞：光明日報刊文:為什么印度難以...
紀檢監(jiān)察機關統(tǒng)籌用好基層監(jiān)督力量精...
紀檢監(jiān)察機關統(tǒng)籌用好基層監(jiān)督力量精...
總投資約36億元，惠州新材料產業(yè)園再引5...
觀焦點：魍魎魑魅怎么讀什么意思？它...
選流量卡如何避坑？這三步曲你都了解了嗎？
選流量卡如何避坑？這三步曲你都了解了嗎？
俠探杰克第一季豆瓣（影評下午茶之俠探...
俠探杰克第一季豆瓣（影評下午茶之俠探...
將于7月內上市新款榮威i5官圖發(fā)布
淘寶林彎彎是誰_林彎彎淘寶店
淘寶林彎彎是誰_林彎彎淘寶店
【天天播資訊】琿春市積極構建和諧勞動...
【天天播資訊】琿春市積極構建和諧勞動...
三終端上人難，邀約棘手。
GDR發(fā)行熱度持續(xù)上升多家龍頭企業(yè)扎堆...
GDR發(fā)行熱度持續(xù)上升多家龍頭企業(yè)扎堆...
國寶“體驗”端午文化當前焦點
國寶“體驗”端午文化當前焦點
【環(huán)球報資訊】OPPO A57打開飛行模式方法介紹
近親屬和親屬的區(qū)別_近親屬|當前看點
近親屬和親屬的區(qū)別_近親屬|當前看點
當前視訊！二建報名時間2021年_2021年二...
當前視訊！二建報名時間2021年_2021年二...
焦點熱訊:華中科技大學地址在哪個城市_...

科技

· 2023最建議買的二手手機推薦？2023最建議買
· 為什么懂手機的人都不用華為？為什么很多人
· 華為oppo手機同等價位哪個好？三千左右買華
· oppo和華為誰用久了可以不卡？oppo手機好還
· oppo萬能密碼6位數解鎖是什么？OPPO手機的
· 如何打開oppo手機鎖屏密碼？oppo手機密碼鎖
· OPPO手機怎么總是自己跳轉快應用？OPPO打開
· oppo手機像中毒似的彈出廣告？oppo手機老是
· oppo手機熱點資訊如何徹底關掉？oppo手機老
· oppo手機開發(fā)者選項在哪里能打開？oppo手機

熱文

環(huán)球報道:[今日關注] 南昌男科醫(yī)院男科收費高嗎排名公開
證監(jiān)會立案！此前剛遭上交所紀律處分！-觀焦點
深圳中國國際旅行社有限公司（關于深圳中國國際旅行社有限公司介紹）|報道
基金分紅：方正富邦穩(wěn)豐一年定開債券發(fā)起基金6月27日分紅
樹欲靜風而不止的意思_樹欲靜風不止什么意思是什么
當前速看：大摩：維持MP Materials(MP.US)評級
獨臂背山工穿梭懸崖絕壁，運125斤重的一筐粽子：想讓家人過上好日子-全球速看料
世界播報:新疆挖掘南疆特色產業(yè)潛力
欠了信用卡11年沒還，不還產生什么后果_全球最資訊
她曾經在23歲時走紅，卻被身高限制戲路，老公也是優(yōu)秀的演員！|每日熱文

国产爱久久久精品_看**视频一一级毛片_91啪国自产中文字幕在线_国内精品伊人久久久久妇

科技

熱文