七分之一在線(xiàn)評(píng)論都有假,人工智能救一把?
摘要: 七分之一在線(xiàn)評(píng)論都有假,人工智能救一把?
據(jù)目測(cè),評(píng)論區(qū)是中國(guó)文學(xué)大師密度最高,罵人水平最高和逗逼水準(zhǔn)最高的地方,A站B站還把評(píng)論玩成彈幕。
平臺(tái)型APP因“評(píng)論”文化的迥異,體現(xiàn)出別樣的審美與趣味,知乎體、爺青回,成為“時(shí)髦”的暗號(hào)。
在宏觀層面,“網(wǎng)民評(píng)論”被定義為具有輿論屬性和廣泛的社會(huì)動(dòng)員能力。所以,排查、約談、暫停、整改、審核也都是管理機(jī)構(gòu)的常用“大錘”。
評(píng)論區(qū),是難以忽視的公共地區(qū)。
有一批活躍的、對(duì)社區(qū)品牌有認(rèn)同,并產(chǎn)生大量?jī)?yōu)質(zhì)內(nèi)容的用戶(hù),是社區(qū)的福氣。
表面上 “評(píng)論區(qū)”肩負(fù)社區(qū)氛圍組的重任,是互聯(lián)網(wǎng)“公共場(chǎng)所”。
背地里,分享意見(jiàn)左右消費(fèi)決策,進(jìn)而影響生意。(根據(jù)英國(guó)政府的數(shù)據(jù),僅在英國(guó),在線(xiàn)評(píng)論每年就影響了約280億美元的酒旅預(yù)訂交易。)
而評(píng)論區(qū)不是烏托邦:
大眾點(diǎn)評(píng)(數(shù)量質(zhì)量都不高,沒(méi)營(yíng)養(yǎng)的口水評(píng)論多)
小紅書(shū)(水軍多,付費(fèi)版高級(jí)測(cè)評(píng)師云集)
淘寶(數(shù)量多,看得累,返現(xiàn)金,得好評(píng))
馬蜂窩(偷偷搬運(yùn)別人家的評(píng)論據(jù)被實(shí)錘了)
這不是單一現(xiàn)象,外媒CNN甚至拋出一個(gè)數(shù)字:全球互聯(lián)網(wǎng),七分之一的酒旅在線(xiàn)評(píng)論是假的。
“評(píng)論區(qū)”青山常在,柴不斷,就繞不過(guò)人工智能(AI)的重要方向,自然語(yǔ)言處理(NLP),讓計(jì)算機(jī)像人類(lèi)一樣對(duì)“中文/文字”進(jìn)行理解。
群眾高呼,請(qǐng)AI緊急上線(xiàn),內(nèi)容檢測(cè)、水軍識(shí)別、臟話(huà)刪除、不良內(nèi)容處理。
01、自然語(yǔ)言處理技術(shù),挺行的
話(huà)說(shuō),NLP技術(shù)在互聯(lián)網(wǎng)大廠已經(jīng)用得非常好了,搜索、推薦、廣告、智能助理等許多系統(tǒng)中都有身影,技術(shù)團(tuán)隊(duì)緊咬學(xué)術(shù)前沿。
先看工業(yè)界,新東方教育2018年就開(kāi)始有學(xué)員用戶(hù)畫(huà)像項(xiàng)目,進(jìn)行等級(jí)分類(lèi)。NLP技術(shù)對(duì)相關(guān)結(jié)構(gòu)化數(shù)據(jù)文本,數(shù)據(jù)標(biāo)簽化,并增加用戶(hù)圈選和行為事件分析功能,各個(gè)業(yè)務(wù)部門(mén)可以根據(jù)標(biāo)簽圈選學(xué)員。
汽車(chē)之家機(jī)器學(xué)習(xí)小組,為機(jī)器之家用戶(hù)產(chǎn)品中心下屬認(rèn)知智能組,NLP技術(shù)支持用戶(hù)選車(chē),多輪對(duì)話(huà)。
2020年,京東智聯(lián)云在雙十一的第一個(gè)小時(shí),情感智能客服服務(wù)138萬(wàn)次,使用情感識(shí)別、語(yǔ)音交互等智能化技術(shù)。
美團(tuán)搜索,用機(jī)器理解用戶(hù)的各種查詢(xún)意圖??墒?,用戶(hù)意圖會(huì)隨著時(shí)間變化,在有限的關(guān)鍵詞中解讀出非常豐富的信號(hào),用于各種搜索的召回、排序以及展示。美團(tuán)專(zhuān)門(mén)設(shè)有人工智能平臺(tái)/搜索與NLP部門(mén)。
再者,美團(tuán)大腦挖掘、關(guān)聯(lián)各個(gè)場(chǎng)景數(shù)據(jù),用人工智能算法讓機(jī)器“閱讀”用戶(hù)針對(duì)商戶(hù)的公開(kāi)評(píng)論,理解用戶(hù)在菜品、價(jià)格、服務(wù)、環(huán)境等方面的喜好,構(gòu)建人、店、商品、場(chǎng)景之間的知識(shí)關(guān)聯(lián),可以認(rèn)為是“餐飲娛樂(lè)的知識(shí)大腦”,支持搜索、SaaS 收銀、金融、外賣(mài)業(yè)務(wù)服務(wù)。
作為一種非結(jié)構(gòu)化文本,用戶(hù)評(píng)論蘊(yùn)含了大量非標(biāo)準(zhǔn)表達(dá)的“單詞”。
機(jī)器根據(jù)句子所在上文的一系列“單詞”,預(yù)測(cè)后面會(huì)跟哪個(gè)“單詞”,預(yù)測(cè)的是概率大小,句子里面每個(gè)“單詞”都有個(gè)根據(jù)上文預(yù)測(cè)的過(guò)程,把所有這些“單詞”的產(chǎn)生概率乘起來(lái),數(shù)值越大,代表這句話(huà)越像一句人話(huà),而不是鬼話(huà)或者胡話(huà)。
所以,除了人類(lèi),機(jī)器也可以判斷,哪個(gè)句子更像一句人話(huà)。
“黃鶴樓”一詞,可能有三個(gè)意思。武昌蛇山之巔的名樓,北京的商家,湖北香煙品牌。AI算法也不傻,預(yù)測(cè)則可結(jié)合上下文,前文在講長(zhǎng)江、景點(diǎn)、旅游、票價(jià)、登高遠(yuǎn)眺,就不會(huì)推測(cè)出此處的“黃鶴樓”是在講香煙,而是景點(diǎn)的概率更大。
再比如貓眼文娛,可以獲取電影、電視劇、藝人等信息,形成一部“詞典”。但是隨著搜索體量增大,搜索表述復(fù)雜,詞典滿(mǎn)足不了用戶(hù)需求,就會(huì)使用AI模型,作為詞典的補(bǔ)充。
再看學(xué)術(shù)界,誕生了名叫Transformer的模型(一種深度神經(jīng)網(wǎng)絡(luò)),基于Transformer的 BERT模型(2018年技術(shù)重大進(jìn)展),GPT模型(硅谷OpenAI實(shí)驗(yàn)室出品),它們都使用預(yù)訓(xùn)練和微調(diào)的思路來(lái)解決問(wèn)題。
預(yù)訓(xùn)練語(yǔ)言模型,就像在無(wú)標(biāo)注文本的大海里,學(xué)到潛在的語(yǔ)義信息,而無(wú)需為每一項(xiàng)任務(wù)單獨(dú)標(biāo)注大量訓(xùn)練數(shù)據(jù)。語(yǔ)言模型預(yù)訓(xùn)練結(jié)束,再使用少量標(biāo)注語(yǔ)料進(jìn)行微調(diào)(Fine-tuning)來(lái)完成具體的NLP任務(wù),比如分類(lèi)、序列標(biāo)注、句間關(guān)系判斷和機(jī)器閱讀理解等。
總之,算法的“性能”得到顯著改善,BERT做大了NLP技術(shù)的蛋糕。
02、運(yùn)營(yíng)組,也挺行的
《親愛(ài)的數(shù)據(jù)》和幾位互聯(lián)網(wǎng)大廠的運(yùn)營(yíng)小哥哥聊了一會(huì),各家“評(píng)論”的運(yùn)營(yíng)花了很多心思。
抖音的評(píng)論區(qū)是雙軌制,既有最熱的評(píng)論,也有最新的評(píng)論。最新的評(píng)論可以理解為一個(gè)小池子,根據(jù)用戶(hù)的點(diǎn)贊數(shù)量,來(lái)看要不要繼續(xù)推。這樣能保證發(fā)得比較晚的神評(píng)論也能排上來(lái),屬于推薦思想在評(píng)論區(qū)的一種應(yīng)用。
抖音搜索是有考慮過(guò)識(shí)別到評(píng)論區(qū)如果提問(wèn)的人比較多,會(huì)有提示搜索的建議。但路徑太長(zhǎng),直接改成了目前的高熱社會(huì)類(lèi)視頻下面,加一個(gè)今日頭條的文章鏈接。
常見(jiàn)的處理評(píng)論區(qū)數(shù)據(jù)的方法是結(jié)構(gòu)化,電商和酒旅APP都對(duì)幾十億條評(píng)論區(qū)做了結(jié)構(gòu)化處理,這里是指對(duì)數(shù)據(jù)做結(jié)構(gòu)化處理,因?yàn)橛?jì)算機(jī)能處理的都是結(jié)構(gòu)化的,非結(jié)構(gòu)化的數(shù)據(jù)它理解不了,所以文本在涉及到“理解”這一層,都是需要先結(jié)構(gòu)化。
NLP分析了評(píng)價(jià),提煉了“分詞”,加了結(jié)構(gòu)化的外展,相當(dāng)于找到了“標(biāo)注”,提高了用戶(hù)瀏覽評(píng)論的效率。英雄所見(jiàn)略同,用戶(hù)理所當(dāng)然的認(rèn)為,人數(shù)越多,觀點(diǎn)越可信。
日常中,在淘寶購(gòu)買(mǎi)一款升降桌,“安裝效果好”“質(zhì)量好”“用后感覺(jué)好”。選酒店的時(shí)候,你能看到多少人提到了“便宜”、“舒適”,又有多少人提到了“安靜”“交通方便”。
很顯然,消費(fèi)+社區(qū)的評(píng)論會(huì)有門(mén)檻,淘寶、小紅書(shū)、大眾點(diǎn)評(píng)、馬蜂窩等。商品沒(méi)下單,沒(méi)經(jīng)歷的用戶(hù)不能參與評(píng)論。
看熱鬧的是外行,探店的往往是內(nèi)行,平臺(tái)會(huì)傾向把好評(píng)往前排,促進(jìn)轉(zhuǎn)化,消費(fèi)后的訴求也會(huì)偏多,需要專(zhuān)門(mén)的回應(yīng),處理。純娛樂(lè)、純討論的社區(qū),參與評(píng)論的門(mén)檻低,抖音、快手、B站、芒果、豆瓣。
一般來(lái)說(shuō),電商評(píng)論運(yùn)營(yíng)得好,有賣(mài)貨的訴求,大家聊的都是和商品相關(guān)的。
小紅書(shū)的鐵粉認(rèn)為,雖然很多評(píng)價(jià)都是花錢(qián)買(mǎi)的。大V粉絲量多了就會(huì)接廣告。但是,小紅書(shū)整體測(cè)評(píng)感比較強(qiáng),和無(wú)腦水軍還不太一樣,即使是托兒,也寫(xiě)得很誠(chéng)懇。
評(píng)論是“UGC(用戶(hù)生產(chǎn)的內(nèi)容)”,既真實(shí),又新鮮,可以挖掘出潛在商業(yè)價(jià)值。對(duì)用戶(hù)來(lái)說(shuō),人人都需要“真實(shí)”而且“好用”的評(píng)論,無(wú)論是“經(jīng)驗(yàn)”“干貨”,還是“指南”。
03、為啥沒(méi)有管好“評(píng)論”?
技術(shù)這么硬,起點(diǎn)這么高,為啥還管不好“評(píng)論區(qū)”。
這里,有三個(gè)絆腳石:第一,評(píng)論數(shù)據(jù)質(zhì)量特別差,注意“特別”兩字。
數(shù)據(jù)治理水平低導(dǎo)致人工智能算法在很多時(shí)候效果不好。算法效果的好壞,與訓(xùn)練數(shù)據(jù)有很大關(guān)系,可以說(shuō)一份好的標(biāo)注數(shù)據(jù),用一個(gè)普通的算法,也能有好的性能。現(xiàn)實(shí)中,企業(yè)想要做好 NLP,首先需要打通基礎(chǔ)數(shù)據(jù)。評(píng)論數(shù)據(jù)的底子太差,麻袋上繡花,白費(fèi)勁。
第二,“假裝”在用。
反正大家都在智能化,裝也得裝著在用。把AI技術(shù)用起來(lái),是“老板們”的剛需。有時(shí)候,工程會(huì)退化到自動(dòng)化階段,只是少部分用了算法智能。目前做得多的,也就是情感傾向分析,垃圾評(píng)論過(guò)濾等等。AI用不好,會(huì)變成噱頭,可能倒退到最基礎(chǔ)的統(tǒng)計(jì)分析圖表。
第三,不重視。
很多互聯(lián)網(wǎng)廠商認(rèn)為,評(píng)論區(qū)是第二場(chǎng)景,有些二等公民的意味。
說(shuō)白了,不夠重視,或者說(shuō)支持主要業(yè)務(wù)“(推薦和搜索)”的技術(shù)還做得不夠好,根本顧不上評(píng)論區(qū)。挖掘得不夠,應(yīng)用的深度和廣度不夠。管理評(píng)論的主動(dòng)力之一就是只是滿(mǎn)足政府管理部門(mén)的監(jiān)管要求。
綜上,NLP技術(shù)對(duì)運(yùn)營(yíng)的號(hào)召力還不夠大,影響還不夠深刻,NLP與運(yùn)營(yíng)還沒(méi)有形成彼此不分的魚(yú)水關(guān)系。
英國(guó)南安普頓大學(xué)畢業(yè)的AI算法科學(xué)家袁雪瑤,也在采訪(fǎng)中透露:“互聯(lián)網(wǎng)廠商會(huì)針對(duì)用戶(hù)發(fā)布的評(píng)論內(nèi)容有半人工識(shí)別,加上人工的數(shù)據(jù)標(biāo)注。NLP現(xiàn)在比較成熟的領(lǐng)域有,情感分析、輿情分析、和用戶(hù)畫(huà)像,這些會(huì)對(duì)運(yùn)營(yíng)有比較適中的影響?!保ɑ谏疃葘W(xué)習(xí)的情感分類(lèi)方法,它能夠從海量的數(shù)據(jù)中主動(dòng)學(xué)習(xí)文本中的語(yǔ)義信息并獲得文本的特征與情感分類(lèi),達(dá)到精準(zhǔn)提取文本數(shù)據(jù)與情感的目的。比如“消極”“積極”)
一位來(lái)自平安智匯企業(yè)有限公司的算法專(zhuān)家也認(rèn)為:“評(píng)論里,口水多,分析就是得把其中有價(jià)值的給自動(dòng)篩選出來(lái)。NLP技術(shù)正在解決問(wèn)題,還做不到藥到病除。”
“適中”一詞用得特別好,NLP還有很大的戰(zhàn)場(chǎng),要與運(yùn)營(yíng)做盟軍,攻克業(yè)務(wù)側(cè)的難題。
評(píng)論中使用的挖掘技術(shù)方法也包含了很多種,規(guī)則、傳統(tǒng)機(jī)器學(xué)習(xí)模型、深度學(xué)習(xí)模型等。
雖然專(zhuān)職挖掘“評(píng)論”商業(yè)價(jià)值的明星AI產(chǎn)品似乎還沒(méi)有出現(xiàn),但是,有人注意到了。
東京大學(xué)的創(chuàng)業(yè)企業(yè)TDAI Lab認(rèn)為應(yīng)該面向點(diǎn)評(píng)網(wǎng)站等推銷(xiāo)人工智能工具。
他們分析了4000多個(gè)日式拉面餐廳的評(píng)論,發(fā)布了東京版“人工智能排名,最優(yōu)百家拉面店”。
在剔除疑似“刷好評(píng)”和“惡意差評(píng)”的情況下,人工智能選出了評(píng)價(jià)高的店鋪。
分析“評(píng)論區(qū)”不立刻關(guān)乎生死,又能給企業(yè)降本增效的場(chǎng)景不應(yīng)該被忽視。
AI 技術(shù)需要算力,需要數(shù)據(jù),需要算法模型,更需要應(yīng)用場(chǎng)景。很多AI公司一開(kāi)始就想給高速列車(chē)換輪子,以這種雄心壯志去敲開(kāi)傳統(tǒng)企業(yè)的大門(mén)成功率很低,因?yàn)榭蛻?hù)對(duì)新技術(shù)和AI公司都沒(méi)有信任。
刷好評(píng)和惡意差評(píng),消費(fèi)者和餐飲店都有損失。消費(fèi)者找不到好店,好店也失去了商機(jī)。
1968年,哈定(Garrett Hadin)在《科學(xué)》雜志上發(fā)表了一篇文章,題為T(mén)he Tragedyof the Commons。譯成《公地悲劇》,原文中的the commons還包括公共的空間。
評(píng)論區(qū)環(huán)境的惡化,沒(méi)有人是贏家。
AI審核、AI接管評(píng)論區(qū)是必然趨勢(shì),“評(píng)論”需要才華,管好“評(píng)論”更需要才華。
在線(xiàn)評(píng)論,人工智能






