Meta(META)開(kāi)源了多感官人工智能模型ImageBind
摘要: Meta(META)宣布了一個(gè)新的開(kāi)源人工智能模型ImageBind,該模型是第一個(gè)將六種類(lèi)型的數(shù)據(jù)結(jié)合到一個(gè)單一的嵌入空間的模型。六種數(shù)據(jù)包括視覺(jué)(圖像和視頻形式);熱能(紅外圖像);文本;音頻;深
Meta(META)宣布了一個(gè)新的開(kāi)源人工智能模型ImageBind,該模型是第一個(gè)將六種類(lèi)型的數(shù)據(jù)結(jié)合到一個(gè)單一的嵌入空間的模型。六種數(shù)據(jù)包括視覺(jué)(圖像和視頻形式);熱能(紅外圖像);文本;音頻;深度信息;以及最有趣的--由慣性測(cè)量單元或IMU產(chǎn)生的運(yùn)動(dòng)讀數(shù)。

該模型目前只是一個(gè)研究項(xiàng)目,沒(méi)有直接的消費(fèi)者或?qū)嶋H應(yīng)用,但它指出了生成性人工智能系統(tǒng)的未來(lái),可以創(chuàng)造沉浸式多感官體驗(yàn)。
模型






