為了學(xué)習(xí)人類Google AI "看"了幾萬(wàn)部電影
摘要: 要AI識(shí)別人類的行為動(dòng)作至今仍是一個(gè)難題,而四個(gè)月大的嬰兒就能識(shí)別各種面部表情了。Google正在讓自家的AI克服這個(gè)難題,最近Google發(fā)布了新的人類動(dòng)作數(shù)據(jù)庫(kù)集體AVAGoogle正在讓自家的AI克服這個(gè)難題,最近Google發(fā)布了新的人類動(dòng)作數(shù)據(jù)庫(kù)集體AVA(atomic在AVA的數(shù)據(jù)分析中,會(huì)對(duì)每個(gè)視頻片段的每個(gè)人物動(dòng)作進(jìn)行識(shí)別,發(fā)現(xiàn)了人類的的行為往往不是單一的,從而進(jìn)行學(xué)習(xí)和記錄。
人工智能的普及已經(jīng)可以幫助甚至替代人類完成很多事情了,但是在業(yè)內(nèi)一直有一個(gè)說(shuō)法:"五歲以上的人類能夠做的事情,機(jī)器人(300024) 都能輕松勝任,但學(xué)會(huì)走路,辦不到。"其實(shí)日常我們的行走的過程就是一個(gè)大腦進(jìn)行精密計(jì)算的過程,只是走路整個(gè)過程太連貫我們大腦已經(jīng)適應(yīng)了這樣的處理方式,我們便無(wú)法感知。

可行走機(jī)器人(圖片來(lái)自baidu)
簡(jiǎn)單來(lái)說(shuō),要AI識(shí)別人類的行為動(dòng)作至今仍是一個(gè)難題,而四個(gè)月大的嬰兒就能識(shí)別各種面部表情了。
Google正在讓自家的AI克服這個(gè)難題,最近Google發(fā)布了新的人類動(dòng)作數(shù)據(jù)庫(kù)集體AVA(atomic visual actions),可以精準(zhǔn)標(biāo)注視頻中的多人動(dòng)作,而其學(xué)習(xí)的對(duì)象則是來(lái)自Youtube的海量視頻。

YouTube視頻(圖片來(lái)自YouTube)
在AVA的數(shù)據(jù)分析中,會(huì)對(duì)每個(gè)視頻片段的每個(gè)人物動(dòng)作進(jìn)行識(shí)別,發(fā)現(xiàn)了人類的的行為往往不是單一的,從而進(jìn)行學(xué)習(xí)和記錄。
同時(shí)為了盡可能覆蓋更大范圍的人類行為,AVA的所分析的電影或劇集,采用了不同國(guó)家和類型的影片,這也可能是為了避免出現(xiàn)性別歧視和種族歧視。

AVA的分析數(shù)據(jù)
Google還將對(duì)外開放這一數(shù)據(jù)庫(kù),最終目的是提高AI系統(tǒng)的「社交視覺智能」,從而了解人類正在做什么,甚至預(yù)測(cè)人類下一步要做什么。
Google AI






