谷歌發(fā)布Gemini大模型,多模態(tài)帶動(dòng)算力需求提升
摘要: 12月6日晚,谷歌發(fā)布最新Gemini大模型,Gemini基于Transformer decoder構(gòu)建的多模態(tài)模型,首次在MMLU測(cè)評(píng)上超過(guò)人類專家,在32個(gè)多模態(tài)基準(zhǔn)中取得30個(gè)SOTA,可同時(shí)識(shí)別理解文本、圖像、音頻、視頻和代碼五種信息,幾乎全方位超越GPT-4
12月6日晚,谷歌發(fā)布最新Gemini大模型,Gemini基于Transformer decoder構(gòu)建的多模態(tài)模型,首次在MMLU測(cè)評(píng)上超過(guò)人類專家,在32個(gè)多模態(tài)基準(zhǔn)中取得30個(gè)SOTA,可同時(shí)識(shí)別理解文本、圖像、音頻、視頻和代碼五種信息,幾乎全方位超越GPT-4。 Gemini有三個(gè)版本:適用于高度復(fù)雜任務(wù)的Gemini Ultra、適用于各種任務(wù)的最佳模型Gemini Pro,以及適用于端側(cè)設(shè)備的Gemini Nano,端側(cè)主要是指能在手機(jī)、平板、PC上直接運(yùn)行。谷歌聊天機(jī)器人Bard已經(jīng)集成Gemini Pro的微調(diào)版,Pixel 8 Pro成為首款搭載Gemini Nano的智能手機(jī),Gemini Pro將于美國(guó)時(shí)間12月13日開(kāi)始向開(kāi)發(fā)者提供API。Gemini代表著AI模型的巨大飛躍,谷歌搜索、廣告、瀏覽器、地圖、Android等將引入新的AI服務(wù)。 隨著多模態(tài)大模型技術(shù)升級(jí),GPT-5等模型的推出,在自動(dòng)駕駛、視頻生成等AIGC應(yīng)用有望加速。關(guān)注谷歌應(yīng)用的AI產(chǎn)品化商業(yè)化進(jìn)展,以及對(duì)行業(yè)帶來(lái)的整體影響。預(yù)計(jì)Gemini有萬(wàn)億參數(shù),訓(xùn)練所用的算力甚至達(dá)到GPT-4的五倍。
Gemini,模型,谷歌






