網(wǎng)絡(luò)消費網(wǎng) >  科技 > > 正文
        Meta AI推出“雜食者”模型,搞定圖像、視頻和3D三大分類任務(wù)
        時間:2022-01-24 16:50:07

        1 月 24 日消息,最近,Meta AI 推出了這樣一個“雜食者”(Omnivore)模型,可以對不同視覺模態(tài)的數(shù)據(jù)進(jìn)行分類,包括圖像、視頻和 3D 數(shù)據(jù)。

        比如面對最左邊的圖像,它可以從深度圖、單視覺 3D 圖和視頻數(shù)據(jù)集中搜集出與之最匹配的結(jié)果。

        這在之前,都要分用不同的模型來實現(xiàn);現(xiàn)在一個模型就搞定了。

        而且 Omnivore 易于訓(xùn)練,使用現(xiàn)成的標(biāo)準(zhǔn)數(shù)據(jù)集,就能讓其性能達(dá)到與對應(yīng)單模型相當(dāng)甚至更高的水平。

        實驗結(jié)果顯示,Omnivore 在圖像分類數(shù)據(jù)集 ImageNet 上能達(dá)到 86.0% 的精度,在用于動作識別的 Kinetics 數(shù)據(jù)集上能達(dá) 84.1%,在用于單視圖 3D 場景分類的 SUN RGB-D 也獲得了 67.1%。

        另外,Omnivore 在實現(xiàn)一切跨模態(tài)識別時,都無需訪問模態(tài)之間的對應(yīng)關(guān)系。

        不同視覺模態(tài)都能通吃的“雜食者”

        Omnivore 基于 Transformer 體系結(jié)構(gòu),具備該架構(gòu)特有的靈活性,并針對不同模態(tài)的分類任務(wù)進(jìn)行聯(lián)合訓(xùn)練。

        模型架構(gòu)如下:

        Omnivore 會將輸入的圖像、視頻和單視圖 3D 圖像轉(zhuǎn)換為 embedding,并饋送到 Transformer 中。

        雖然它可以使用任何 vision transformer 架構(gòu)來處理 patch embedding,但鑒于 Swin transformer 在圖像和視頻任務(wù)上的強(qiáng)大性能,這里就使用該架構(gòu)作為基礎(chǔ)模型。

        具體來說,Omnivore 將圖像轉(zhuǎn)為 patch,視頻轉(zhuǎn)為時空 tube(spatio-temporal tube),單視圖 3D 圖像轉(zhuǎn)為 RGB patch 和深度 patch。

        然后使用線性層將 patches 映射到到 embedding 中。其中對 RGB patch 使用同一線性層,對深度 patch 使用單獨的。

        總的來說,就是通過 embedding 將所有視覺模式轉(zhuǎn)換為通用格式,然后使用一系列時空注意力(attention)操作來構(gòu)建不同視覺模式的統(tǒng)一表示。

        研究人員在 ImageNet-1K 數(shù)據(jù)集、Kinetics-400 數(shù)據(jù)集和 SUN RGB-D 數(shù)據(jù)集上聯(lián)合訓(xùn)練出各種 Omnivore 模型。

        這種方法類似于多任務(wù)學(xué)習(xí)和跨模態(tài)對齊,但有 2 點重要區(qū)別:

        1、不假設(shè)輸入觀測值對齊(即不假設(shè)圖像、視頻和 3D 數(shù)據(jù)之間的對應(yīng)關(guān)系);

        2、也不假設(shè)這些數(shù)據(jù)集共享相同的標(biāo)簽空間(label space)。

        性能超 SOTA

        實驗方面,首先將 Omnivore 與各視覺模態(tài)對應(yīng)的特定模型(下表中指 Specific)進(jìn)行比較。

        一共有三種不同的模型尺寸:T、S 和 B。

        預(yù)訓(xùn)練模型在七個下游任務(wù)上都進(jìn)行了微調(diào)。

        圖像特定模型在 IN1K 上預(yù)訓(xùn)練。視頻特定模型和單視圖 3D 特定模型均使用預(yù)訓(xùn)練圖像特定模型的 inflation 進(jìn)行初始化,并分別在 K400 和 SUN RGB-D 上進(jìn)行微調(diào)。

        結(jié)果發(fā)現(xiàn),Omnivore 在幾乎所有的下游任務(wù)上的性能都相當(dāng)于或優(yōu)于各特定模型。

        其中尺寸最大的 Swin-B 實現(xiàn)了全部任務(wù)上的 SOTA。

        將 Omnivore 與具有相同模型架構(gòu)和參數(shù)數(shù)量的特定模型比較也是相同的結(jié)果。

        其中 Omnivore 在 IN1K、K400 和 SUN 數(shù)據(jù)集上從頭開始聯(lián)合訓(xùn)練,而特定模態(tài)的模型針對每個數(shù)據(jù)集專門訓(xùn)練:

        ImageSwin 模型從零開始訓(xùn)練,VideoSwin 和 DepthSwin 模型則從 ImageSwin 模型上進(jìn)行微調(diào)。

        接下來將 Omnivore 與圖像、視頻和 3D 數(shù)據(jù)分類任務(wù)上的 SOTA 模型進(jìn)行比較。

        結(jié)果仍然不錯,Omnivore 在所有預(yù)訓(xùn)練任務(wù)中都表現(xiàn)出了優(yōu)于 SOTA 模型的性能(下圖從上至下分別為圖像、視頻和 3D 數(shù)據(jù))。

        此外,在 ImageNet-1K 數(shù)據(jù)集上檢索給定 RGB 圖像的深度圖也發(fā)現(xiàn),盡管 Omnivore 沒有接受過關(guān)于 1K 深度圖的訓(xùn)練,但它也能夠給出語義相似的正確答案。

        最后,作者表示,盡管這個“雜食者”比傳統(tǒng)的特定模式模型有了很多進(jìn)步,但它有一些局限性。

        比如目前它僅適用于單視圖 3D 圖像,不適用于其他 3D 表示,如體素圖(voxels)、點云圖等。

        關(guān)鍵詞: 模型 圖像 模態(tài) 數(shù)據(jù) omnivore 架構(gòu) 視頻 雜食者 視覺 sota

        版權(quán)聲明:
            凡注明來網(wǎng)絡(luò)消費網(wǎng)的作品,版權(quán)均屬網(wǎng)絡(luò)消費網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:網(wǎng)絡(luò)消費網(wǎng)"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
            除來源署名為網(wǎng)絡(luò)消費網(wǎng)稿件外,其他所轉(zhuǎn)載內(nèi)容之原創(chuàng)性、真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考并自行核實。
        熱文

        網(wǎng)站首頁 |網(wǎng)站簡介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
         

        Copyright © 2000-2020 www.fnsyft.com All Rights Reserved.
         

        中國網(wǎng)絡(luò)消費網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
         

        聯(lián)系郵箱:920 891 263@qq.com

        備案號:京ICP備2022016840號-15

        營業(yè)執(zhí)照公示信息

        亚洲国产成人精品电影| 久久国产精品亚洲综合| 777亚洲精品乱码久久久久久 | 亚洲蜜芽在线精品一区| 亚洲av无码不卡| 亚洲AV无码乱码在线观看裸奔| 久久精品国产精品亚洲精品 | 国产亚洲情侣一区二区无| 亚洲精品动漫人成3d在线 | 免费在线观看亚洲| 日韩成人精品日本亚洲| 日本中文一区二区三区亚洲| 无码不卡亚洲成?人片| 一区二区三区亚洲视频| 亚洲国产一成久久精品国产成人综合 | 亚洲精品视频在线观看免费| 亚洲黄色在线观看网站| 亚洲成年人电影在线观看| 亚洲国产精品日韩在线观看 | 亚洲精品A在线观看| 久久久久亚洲精品天堂久久久久久| 亚洲一区日韩高清中文字幕亚洲| 国产亚洲人成网站在线观看| 亚洲色大成网站www永久一区| 国产精品亚洲片在线观看不卡| 亚洲三区在线观看无套内射| 亚洲av综合色区| 久久精品国产亚洲AV电影| 亚洲欧洲国产成人精品| 亚洲中字慕日产2021| 中文字幕亚洲精品无码| 亚洲a∨国产av综合av下载| 一本久久综合亚洲鲁鲁五月天| 亚洲日韩中文字幕日韩在线| 亚洲日韩一页精品发布| 亚洲图片在线观看| 久久久久精品国产亚洲AV无码| 亚洲欧美aⅴ在线资源| 亚洲成A人片在线观看无码3D| 国产中文在线亚洲精品官网| 亚洲AV永久无码精品一百度影院|