最新要聞
- 用圖像對齊所有模態(tài),Meta開源多感官AI基礎(chǔ)模型,實(shí)現(xiàn)大一統(tǒng)
- 3月新增裝機(jī)同比翻倍,風(fēng)電進(jìn)入成長新周期!社保+養(yǎng)老金盯上風(fēng)塔龍頭,高增長潛力股僅13只-熱訊
- 義翹神州:公司CRO業(yè)務(wù)份額在全球市場占比仍較小 還有較大上升空間_每日時訊
- 全球要聞:學(xué)前必備口心算:20以內(nèi)的進(jìn)退位加減法
- 微動態(tài)丨北京116億元掛牌海淀區(qū)及朝陽區(qū)3宗宅地 占地面積約16.36萬平方米
- 環(huán)球熱頭條丨死刑!重慶姐弟墜亡案二審維持原判 案件始末回顧
- 5月11日國內(nèi)丁二烯市場交投僵持|全球報(bào)道
- 5月11日 10:42分 熱景生物(688068)股價快速拉升
- 【環(huán)球播資訊】琴澳時美生物醫(yī)藥科技 珠海有限公司_關(guān)于琴澳時美生物醫(yī)藥科技 珠海有限公司介紹
- 關(guān)注:大金融板塊繼續(xù)下挫,西安銀行觸及跌停
- 信用卡欠10萬無力償還怎么辦判幾年|每日熱點(diǎn)
- 烏魯木齊:“農(nóng)家樂”大廚展廚藝拼技能|世界信息
- 每日消息!塞薩爾:邁尼昂準(zhǔn)確預(yù)判擋出了哲科的單刀,阻止了國米的第三球
- 全球今亮點(diǎn)!我市研發(fā)的全省首個“一網(wǎng)統(tǒng)管”小程序正式上線
- 這件事讓漢武帝打垮了所有外戚,武帝:我都后悔死了_全球新消息
- 河北大學(xué)研究生院生技院導(dǎo)師名單公布_河北大學(xué)研究生院生技院導(dǎo)師名單
5G

首例5g乳腺手術(shù)價格是多少錢?首例5g乳腺手術(shù)成功率是多少?

電信光纖多少錢一年?電信光纖價格表
- 首例5g乳腺手術(shù)價格是多少錢?首例5g乳腺手術(shù)成功率是多少?
- 電信光纖多少錢一年?電信光纖價格表
- 5g流量消耗會不會很快?手機(jī)打開5g好還是關(guān)閉5G好?
- 5g怎么變成4g信號?5g手機(jī)排名前十名一覽
- 5g和4g的區(qū)別在哪里?5g首批城市名單
- 5g是誰最先研發(fā)出來的?5g是什么意思?
科技
用圖像對齊所有模態(tài),Meta開源多感官AI基礎(chǔ)模型,實(shí)現(xiàn)大一統(tǒng)
機(jī)器之心報(bào)道
機(jī)器之心編輯部
Meta 新的開源模型 ImageBind 將多個數(shù)據(jù)流連接在一起,適用于文本、視頻和音頻等 6 種模態(tài)。
【資料圖】
在人類的感官中,一張圖片可以將很多體驗(yàn)融合到一起,比如一張海灘圖片可以讓我們想起海浪的聲音、沙子的質(zhì)地、拂面而來的微風(fēng),甚至可以激發(fā)創(chuàng)作一首詩的靈感。圖像的這種「綁定」(binding)屬性通過與自身相關(guān)的任何感官體驗(yàn)對齊,為學(xué)習(xí)視覺特征提供了大量監(jiān)督來源。
理想情況下,對于單個聯(lián)合嵌入空間,視覺特征應(yīng)該通過對齊所有感官來學(xué)習(xí)。然而這需要通過同一組圖像來獲取所有感官類型和組合的配對數(shù)據(jù),顯然不可行。
最近,很多方法學(xué)習(xí)與文本、音頻等對齊的圖像特征。這些方法使用單對模態(tài)或者最多幾種視覺模態(tài)。最終嵌入僅限于用于訓(xùn)練的模態(tài)對。因此,視頻 - 音頻嵌入無法直接用于圖像 - 文本任務(wù),反之亦然。學(xué)習(xí)真正的聯(lián)合嵌入面臨的一個主要障礙是缺乏所有模態(tài)融合在一起的大量多模態(tài)數(shù)據(jù)。
今日,Meta AI 提出了 ImageBind ,它通過利用多種類型的圖像配對數(shù)據(jù)來學(xué)習(xí)單個共享表示空間。該研究不需要所有模態(tài)相互同時出現(xiàn)的數(shù)據(jù)集,相反 利用到了圖像的綁定屬性,只要將每個模態(tài)的嵌入與圖像嵌入對齊,就會實(shí)現(xiàn)所有模態(tài)的迅速對齊 。Meta AI 還公布了相應(yīng)代碼。
論文地址:https://dl.fbaipublicfiles.com/imagebind/imagebind_final.pdf
GitHub 地址:https://github.com/facebookresearch/ImageBind
具體而言,ImageBind 利用網(wǎng)絡(luò)規(guī)模(圖像、文本)匹配數(shù)據(jù),并將其與自然存在的配對數(shù)據(jù)(視頻、音頻、圖像、深度)相結(jié)合,以學(xué)習(xí)單個聯(lián)合嵌入空間。這樣做使得 ImageBind 隱式地將文本嵌入與其他模態(tài)(如音頻、深度等)對齊,從而在沒有顯式語義或文本配對的情況下,能在這些模態(tài)上實(shí)現(xiàn)零樣本識別功能。
下圖 2 為 ImageBind 的整體概覽。
與此同時,研究者表示 ImageBind 可以使用大規(guī)模視覺語言模型(如 CLIP)進(jìn)行初始化,從而利用這些模型的豐富圖像和文本表示。因此,ImageBind 只需要很少的訓(xùn)練就可以應(yīng)用于各種不同的模態(tài)和任務(wù)。
ImageBind 是 Meta 致力于創(chuàng)建多模態(tài) AI 系統(tǒng)的一部分,從而實(shí)現(xiàn)從所有相關(guān)類型數(shù)據(jù)中學(xué)習(xí)。隨著模態(tài)數(shù)量的增加,ImageBind 為研究人員打開了嘗試開發(fā)全新整體性系統(tǒng)的閘門,例如結(jié)合 3D 和 IMU 傳感器來設(shè)計(jì)或體驗(yàn)身臨其境的虛擬世界。此外它還可以提供一種探索記憶的豐富方式,即組合使用文本、視頻和圖像來搜索圖像、視頻、音頻文件或文本信息。
綁定內(nèi)容和圖像,學(xué)習(xí)單個嵌入空間
人類有能力通過很少的樣本學(xué)習(xí)新概念,比如如閱讀對動物的描述之后,就可以在實(shí)際生活中認(rèn)出它們;通過一張不熟悉的汽車模型照片,就可以預(yù)測其引擎可能發(fā)出的聲音。這在一定程度上是因?yàn)閱螐垐D像可以將整體感官體驗(yàn)「捆綁」在一起。然而在人工智能領(lǐng)域,雖然模態(tài)數(shù)量一直在增加,但多感官數(shù)據(jù)的缺乏會限制標(biāo)準(zhǔn)的需要配對數(shù)據(jù)的多模態(tài)學(xué)習(xí)。
理想情況下,一個有著不同種類數(shù)據(jù)的聯(lián)合嵌入空間能讓模型在學(xué)習(xí)視覺特征的同時學(xué)習(xí)其他的模態(tài)。此前,往往需要收集所有可能的配對數(shù)據(jù)組合,才能讓所有模態(tài)學(xué)習(xí)聯(lián)合嵌入空間。
ImageBind 規(guī)避了這個難題,它利用最近的大型視覺語言模型它將最近的大規(guī)模視覺語言模型的零樣本能力擴(kuò)展到新的模態(tài),它們與圖像的自然配對,如視頻 - 音頻和圖像 - 深度數(shù)據(jù),來學(xué)習(xí)一個聯(lián)合嵌入空間。針對其他四種模式(音頻、深度、熱成像和 IMU 讀數(shù)),研究者使用自然配對的自監(jiān)督數(shù)據(jù)。
通過將六種模態(tài)的嵌入對齊到一個公共空間,ImageBind 可以跨模態(tài)檢索未同時觀察到的不同類型的內(nèi)容,添加不同模態(tài)的嵌入以自然地對它們的語義進(jìn)行組合,以及結(jié)合使用 Meta AI 的音頻嵌入與預(yù)訓(xùn)練 DALLE-2 解碼器(設(shè)計(jì)用于與 CLIP 文本嵌入)來實(shí)現(xiàn)音頻到圖像生成。
互聯(lián)網(wǎng)上存在大量連同文本一起出現(xiàn)的圖像,因此訓(xùn)練圖像 - 文本模型已經(jīng)得到了廣泛的研究。ImageBind 利用了圖像能與各種模態(tài)相連接的綁定屬性,比如利用網(wǎng)絡(luò)數(shù)據(jù)將文本與圖像連接起來,或者利用在有 IMU 傳感器的可穿戴相機(jī)中捕捉到的視頻數(shù)據(jù)將運(yùn)動與視頻連接起來。
從大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)中學(xué)習(xí)到的視覺表征可以用作學(xué)習(xí)不同模態(tài)特征的目標(biāo)。這使得 ImageBind 將圖像與同時出現(xiàn)的任何模態(tài)對齊,自然地使這些模態(tài)彼此對齊。熱圖和深度圖等與圖像具有強(qiáng)相關(guān)性的模態(tài)更容易對齊。音頻和 IMU(慣性測量單元)等非視覺的模態(tài)則具有較弱的相關(guān)性,比如嬰兒哭聲等特定聲音可以搭配各種視覺背景。
ImageBind 表明,圖像配對數(shù)據(jù)足以將這六種模態(tài)綁定在一起。該模型可以更全面地解釋內(nèi)容,使不同的模態(tài)可以相互「對話」,并在沒有同時觀察它們的情況下找到它們之間的聯(lián)系。例如,ImageBind 可以在沒有一起觀察音頻和文本的情況下將二者聯(lián)系起來。這使得其他模型能夠「理解」新的模態(tài),而不需要任何資源密集型的訓(xùn)練。
ImageBind 強(qiáng)大的 scaling 表現(xiàn)使該模型能夠替代或增強(qiáng)許多人工智能模型,使它們能夠使用其他模態(tài)。例如雖然 Make-A-Scene 可以通過使用文本 prompt 生成圖像,但 ImageBind 可以將其升級為使用音頻生成圖像,如笑聲或雨聲。
ImageBind 的卓越性能
Meta 的分析表明,ImageBind 的 scaling 行為隨著圖像編碼器的強(qiáng)度而提高。換句話說,ImageBind 對齊模態(tài)的能力隨著視覺模型的能力和大小而提升。這表明,更大的視覺模型對非視覺任務(wù)有利,如音頻分類,而且訓(xùn)練這種模型的好處超出了計(jì)算機(jī)視覺任務(wù)的范疇。
在實(shí)驗(yàn)中,Meta 使用了 ImageBind 的音頻和深度編碼器,并將其與之前在 zero-shot 檢索以及音頻和深度分類任務(wù)中的工作進(jìn)行了比較。
在基準(zhǔn)測試上,ImageBind 在音頻和深度方面優(yōu)于專家模型。
Meta 發(fā)現(xiàn) ImageBind 可以用于少樣本音頻和深度分類任務(wù),并且優(yōu)于之前定制的方法。例如,ImageBind 明顯優(yōu)于 Meta 在 Audioset 上訓(xùn)練的自監(jiān)督 AudioMAE 模型,以及在音頻分類上微調(diào)的監(jiān)督 AudioMAE 模型。
此外,ImageBind 還在跨模態(tài)的零樣本識別任務(wù)上取得了新的 SOTA 性能,甚至優(yōu)于經(jīng)過訓(xùn)練以識別該模態(tài)概念的最新模型。
參考鏈接:https://ai.facebook.com/blog/imagebind-six-modalities-binding-ai/
關(guān)鍵詞:
-
用圖像對齊所有模態(tài),Meta開源多感官AI基礎(chǔ)模型,實(shí)現(xiàn)大一統(tǒng)
機(jī)器之心報(bào)道機(jī)器之心編輯部Meta新的開源模型ImageBind將多個數(shù)據(jù)流連接在一起,適用于文本、視頻和音頻等6
來源: -
【環(huán)球快播報(bào)】*ST海投年報(bào)遭問詢 要求說明報(bào)告期實(shí)現(xiàn)凈利潤較修正后的預(yù)計(jì)凈利潤差異較大的原因
*ST海投5月11日收深交所年報(bào)問詢函,公司于2023年3月2日披露《2022年度業(yè)績預(yù)告修正公告》,預(yù)計(jì)公司2022年
來源: -
景格科技2022年上半年虧損922.22萬 同比虧損減少 成本與費(fèi)用減少-實(shí)時
挖貝網(wǎng)8月29日,景格科技(430638)近日發(fā)布2022年半年度報(bào)告,報(bào)告期內(nèi)公司實(shí)現(xiàn)營業(yè)收入31,295,230 3
來源: -
崩了 可轉(zhuǎn)債史上最低價!30年零違約歷史或被打破
在優(yōu)勝劣汰的A股市場環(huán)境下,可轉(zhuǎn)債市場生態(tài)也正在發(fā)生變化。5月11日,*ST搜特股價繼續(xù)一字板跌停,連續(xù)13
來源: 用圖像對齊所有模態(tài),Meta開源多感官AI基礎(chǔ)模型,實(shí)現(xiàn)大一統(tǒng)
【環(huán)球快播報(bào)】*ST海投年報(bào)遭問詢 要求說明報(bào)告期實(shí)現(xiàn)凈利潤較修正后的預(yù)計(jì)凈利潤差異較大的原因
景格科技2022年上半年虧損922.22萬 同比虧損減少 成本與費(fèi)用減少-實(shí)時
崩了 可轉(zhuǎn)債史上最低價!30年零違約歷史或被打破
3月新增裝機(jī)同比翻倍,風(fēng)電進(jìn)入成長新周期!社保+養(yǎng)老金盯上風(fēng)塔龍頭,高增長潛力股僅13只-熱訊
熱頭條丨不是李霄鵬,山東魯能新帥基本鎖定,3選1,亞冠名帥或成黑馬
如何把照片變小放入ppt中_如何把照片變小_環(huán)球觀速訊
低燒是多少度感覺冷_低燒是多少度 焦點(diǎn)觀察
義翹神州:公司CRO業(yè)務(wù)份額在全球市場占比仍較小 還有較大上升空間_每日時訊
每日信息:宏宇新岸線
一勝一平就能晉級?亞洲杯抽簽最大看點(diǎn):國足能贏誰
世界快看點(diǎn)丨燕窩怎么吃營養(yǎng)好_燕窩怎么吃最有營養(yǎng)
【光明時評】燒烤火爆出圈 激發(fā)經(jīng)濟(jì)活力 每日視訊
全球要聞:學(xué)前必備口心算:20以內(nèi)的進(jìn)退位加減法
即時看!四川峨眉山:高山杜鵑漸次開 一路行走一路花
天天實(shí)時:華西證券給予中國人壽買入評級 壽險行業(yè)龍頭 負(fù)債端量穩(wěn)質(zhì)提 目標(biāo)價格為46.3元
微動態(tài)丨北京116億元掛牌海淀區(qū)及朝陽區(qū)3宗宅地 占地面積約16.36萬平方米
采用傳統(tǒng)文化設(shè)計(jì) 紅旗H9+不息藝術(shù)版發(fā)布|今日快訊
觀點(diǎn):歐股周三收跌 歐央行或即將結(jié)束加息
愛成都迎大運(yùn) 全球快看點(diǎn)
環(huán)球熱頭條丨死刑!重慶姐弟墜亡案二審維持原判 案件始末回顧
熱點(diǎn)在線丨石景山首發(fā)律師行業(yè)社會責(zé)任報(bào)告,多項(xiàng)創(chuàng)新舉措全市推廣
西班牙多人因涉嫌非法挖掘水井種植熱帶水果被捕 世界看熱訊
J.D. Power研究:中國消費(fèi)者新能源汽車購買意愿連續(xù)六年上升 全球即時
5月11日國內(nèi)丁二烯市場交投僵持|全球報(bào)道
2022年上市物企CEO薪資榜:超五成降薪,浦江中國降幅83%居首-全球訊息
溫榆河公園油菜花梯田引游客打卡,大片花田被踩出條條“小路” 世界今日訊
馬寨鎮(zhèn)中心幼兒園垃圾分類主題活動舉行
5月11日 10:42分 熱景生物(688068)股價快速拉升
中新社副總編輯俞嵐:彰顯主流媒體責(zé)任擔(dān)當(dāng),賦能中國品牌揚(yáng)帆出海
天舟六號貨運(yùn)飛船與空間站組合體完成交會對接
視焦點(diǎn)訊!上海人警惕!口服玻尿酸,真能讓人變美嗎?
當(dāng)前速讀:會診通知!濟(jì)南膚康中研皮膚病醫(yī)院特邀北京空軍總院專家來院聯(lián)合會診
【環(huán)球播資訊】琴澳時美生物醫(yī)藥科技 珠海有限公司_關(guān)于琴澳時美生物醫(yī)藥科技 珠海有限公司介紹
揭秘“AI+教育”兩大核心路徑|環(huán)球頭條
北京國丹醫(yī)院 PRP-CK國丹色素移植推廣月正式啟動
天天滾動:高考倒計(jì)時不足1個月,教育部部署這個重中之重
環(huán)球速遞!裝飾公司起名_大氣的裝飾公司名字大全
數(shù)碼視訊:全資子公司中標(biāo)歌華有線2022年CMC-OLT設(shè)備采購項(xiàng)目|環(huán)球速看料
哈彌爾頓_哈彌爾頓坎普
關(guān)注:大金融板塊繼續(xù)下挫,西安銀行觸及跌停
云南首家京東MALL將于6月18日開業(yè) 經(jīng)營面積近4萬平方米
天舟六號貨運(yùn)飛船發(fā)射任務(wù)取得圓滿成功
巴頓于洋工體收獲熱烈掌聲 于根偉遺憾被追平斯坦利坦言感受很差 全球?qū)崟r
信用卡欠10萬無力償還怎么辦判幾年|每日熱點(diǎn)
焦點(diǎn)熱門:高考倒計(jì)時不足1個月,教育部部署這個重中之重
當(dāng)前信息:76人隊(duì)最新消息!最佳陣容出爐,多人替哈登鳴不平,老里敲響警鐘
烏魯木齊:“農(nóng)家樂”大廚展廚藝拼技能|世界信息
好讀書是什么意思網(wǎng)絡(luò)用語_好讀書是什么意思 世界關(guān)注
觀焦點(diǎn):有色金屬行業(yè):有色板塊一季報(bào)總結(jié)及展望
德賽電池:融資凈償還394.54萬元,融資余額4.98億元(05-10)
每日消息!塞薩爾:邁尼昂準(zhǔn)確預(yù)判擋出了哲科的單刀,阻止了國米的第三球
熱議:粵桂協(xié)作增強(qiáng)發(fā)展內(nèi)生動力
鞋子是240是多少碼_鞋子240是什么碼簡介介紹
重點(diǎn)聚焦!八字看你適合學(xué)道還是學(xué)佛-皈依三寶是什么意思
全球今亮點(diǎn)!我市研發(fā)的全省首個“一網(wǎng)統(tǒng)管”小程序正式上線
以軍再次空襲加沙 兩天超20人死亡-全球消息
推動數(shù)字賦能 遼寧評定首批省級智慧旅游景區(qū)_世界觀焦點(diǎn)
遏制畸高房產(chǎn)交易中介費(fèi)-天天時快訊
這件事讓漢武帝打垮了所有外戚,武帝:我都后悔死了_全球新消息
大心臟!哲科僅3次出戰(zhàn)歐冠半決賽,面對利物浦&米蘭均取得進(jìn)球
全球快報(bào):express scripts
東華軟件怎么樣待遇|世界熱資訊
河北大學(xué)研究生院生技院導(dǎo)師名單公布_河北大學(xué)研究生院生技院導(dǎo)師名單
全球速看:消息稱蘋果 iPhone 未來改用micro LED面板
世界動態(tài):總曝光量突破20億,快手、余額寶、中青報(bào)共同打造“小掙青年”
5月10日資金流向:裝飾板塊股票資金流向一覽表|信息
干細(xì)胞板塊5月10日漲0.5%,中航產(chǎn)融領(lǐng)漲,主力資金凈流出3.55億元 每日熱訊
轉(zhuǎn)業(yè)士官安置定崗定編相關(guān)文件_轉(zhuǎn)業(yè)士官安置定崗定編 熱資訊
飛機(jī)解體是什么意思呀_飛機(jī)解體是什么意思
關(guān)于林沖的故事情節(jié)以及他的性格特點(diǎn)_關(guān)于林沖的故事情節(jié)
齊齊哈爾景點(diǎn)有哪些_齊齊哈爾景點(diǎn)|世界熱訊
福建龍巖找到3名防汛巡查中落水失聯(lián)干部 均無生命體征 環(huán)球新消息
全球速看:大快人心!中國冰雪官宣,谷愛凌國籍塵埃落定,續(xù)約薪資年薪曝光
全球觀焦點(diǎn):web 8章11節(jié) 翻譯《吵死了》
非法持有毒品罪如何成功取保候?qū)彶淮叮淮稌邪傅讍幔?/a>
熱門看點(diǎn):老小區(qū)清理“頑疾”,營造舒適居住環(huán)境
北部灣港2022年年度每10股派1.73元 股權(quán)登記日為5月16日
2023北京消費(fèi)季夜京城活動啟動 將開展百余項(xiàng)主題活動
有望6月發(fā)布,蘋果MR是否會上演下一個“iPhone時刻”? 焦點(diǎn)速遞
森馬服飾:利潤分配股權(quán)登記日為2023年5月17日
中特估再重估|連續(xù)兩天大跌后,短炒告一段落?后續(xù)如何選股
5G標(biāo)準(zhǔn)必要專利全球排名公布:中國5家企業(yè)榜上有名,蘋果無緣前十_焦點(diǎn)信息
濟(jì)南南郊醫(yī)院護(hù)理部組織《人本位·我先行》主題演講比賽_環(huán)球播報(bào)
義診通知丨5月11日,中國紅十字基金會專家進(jìn)基層大型義診活動走進(jìn)臨沭縣人民醫(yī)院
產(chǎn)后訪視“零”距離,暖心服務(wù)送到家
鄭州市“揭榜領(lǐng)題”指導(dǎo)組赴前程指導(dǎo)社區(qū)治理工作
當(dāng)前報(bào)道:「隴警快訊」臨夏永靖:成功抓獲4名上網(wǎng)逃犯
尼康發(fā)布全畫幅微單數(shù)碼相機(jī)Z 8
真我11 Pro+體驗(yàn)分享!堪稱質(zhì)價比之王,兩億像素實(shí)現(xiàn)越級影像效果_世界快播
春季出游,為什么要選奔騰T99?_天天觀焦點(diǎn)
觀察:世紀(jì)瑞科完成對“交個朋友”全資收購
天天速遞!琴似站_關(guān)于琴似站介紹
全球時訊:100平方室內(nèi)養(yǎng)殖什么?
中國傳統(tǒng)體育項(xiàng)目有哪些_傳統(tǒng)體育項(xiàng)目有哪些_環(huán)球?qū)崟r
求婚用的氣球和花哪里有賣_求好用的qq好友密探
房產(chǎn)中介迎監(jiān)管,透露了什么信號丨南財(cái)號聯(lián)播
捧殺是什么意思呀(捧殺是什么意思)
今熱點(diǎn):廣州vs石家莊功夫首發(fā):廣州隊(duì)輪換多人,王世杰突前凌杰替補(bǔ)
筑牢安全墻危險無處藏——綿陽市萬達(dá)校園展開防災(zāi)減災(zāi)暨應(yīng)急分散演練,具體是怎么回事? 最新快訊