搜狗:神經(jīng)機(jī)器翻譯技術(shù)已達(dá)臨界點(diǎn) 可實(shí)現(xiàn)大規(guī)模商用
摘要: 記者童璐搜狗(NYSE:SOGO)IoT產(chǎn)品總監(jiān)李健濤近期在貴陽數(shù)博會(huì)上表示,搜狗在搜索和輸入法領(lǐng)域的業(yè)務(wù)已持續(xù)十三、四年的時(shí)間,擁有龐大的數(shù)據(jù)積淀,搜狗以“語言”為核心的AI布局具備強(qiáng)大的競(jìng)爭(zhēng)力。搜
記者 童璐
搜狗(NYSE:SOGO) IoT產(chǎn)品總監(jiān)李健濤近期在貴陽數(shù)博會(huì)上表示,搜狗在搜索和輸入法領(lǐng)域的業(yè)務(wù)已持續(xù)十三、四年的時(shí)間,擁有龐大的數(shù)據(jù)積淀,搜狗以“語言”為核心的AI布局具備強(qiáng)大的競(jìng)爭(zhēng)力。搜狗的語音和圖像識(shí)別技術(shù)的日趨成熟、從搜索到問答的變化、從輸入法到對(duì)話的發(fā)展、以及搜狗在AI翻譯領(lǐng)域的推陳出新,都代表著搜狗在AI領(lǐng)域的創(chuàng)新和“進(jìn)擊”。公司認(rèn)為翻譯技術(shù)已經(jīng)達(dá)到臨界點(diǎn),可以真正的大眾民用化。
李健濤把搜狗定義為“中國搜索行業(yè)的挑戰(zhàn)者,是AI領(lǐng)域的創(chuàng)新者。”他稱作為是中國用戶數(shù)第四大的互聯(lián)網(wǎng)公司,搜狗輸入法市場(chǎng)占有率多年蟬聯(lián)第一,搜狗搜索引擎市場(chǎng)份額穩(wěn)居第二位。十幾年來的積累,為搜狗在AI領(lǐng)域的發(fā)展提供了大量的文字和語音數(shù)據(jù)支持,搜狗每日語音調(diào)用次數(shù)超3億,峰值達(dá)3.6億次以上,海量數(shù)據(jù)(603138,股吧)是得天獨(dú)厚的深度學(xué)習(xí)資料,幫助AI在語音識(shí)別、圖像識(shí)別、機(jī)器翻譯等方面日漸趨于精準(zhǔn)、接近真人水平。而“這些數(shù)據(jù)背景是其他公司所不具備的”。
目前搜狗整體人工智能布局也圍繞“語言”展開,主要是語言的兩種載體,一種是語音,一種是圖像”。
李健濤稱,搜狗語音識(shí)別準(zhǔn)確率已達(dá)97%。搜狗的圖像識(shí)別技術(shù)最終實(shí)現(xiàn)了80%的圖像識(shí)別高準(zhǔn)確率,可完成對(duì)犬類、花卉等類似圖片的識(shí)別。此外,搜狗還實(shí)現(xiàn)了唇語的識(shí)別,支持10萬+非特定人詞匯量、口語測(cè)試集60%以上準(zhǔn)確率,在車載或智能家居等垂直場(chǎng)景的命令集中,準(zhǔn)確率達(dá)到90%以上。
在AI翻譯技術(shù)方面,李健濤表示,“在翻譯方面,我們認(rèn)為技術(shù)程度已經(jīng)達(dá)到臨界點(diǎn),可以真正的大眾民用化?!彼Q,基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯技術(shù)是搜狗獨(dú)創(chuàng)的,實(shí)現(xiàn)了語音翻譯、對(duì)話翻譯、文字翻譯、圖像翻譯等豐富的交互翻譯方式,可完成61種語言互譯。目前搜狗翻譯相關(guān)產(chǎn)品日均翻譯請(qǐng)求已達(dá)1.5億次,覆蓋全球超過1000萬用戶。
李健濤稱,目前“神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯技術(shù)”已經(jīng)實(shí)現(xiàn)大規(guī)模商業(yè)應(yīng)用,深入應(yīng)用到搜狗全產(chǎn)品線中,包括可以提供語音、文字翻譯功能的搜狗輸入法、全球首個(gè)跨語言搜索的搜狗英文搜索和全球第一家實(shí)現(xiàn)商用的機(jī)器同傳系統(tǒng)以及智能翻譯硬件搜狗翻譯機(jī)和翻譯筆。
.e公司記者了解到,除了此前推出的搜狗旅行翻譯寶外,搜狗近期推出“錄音翻譯筆”,主要面向?qū)W生、記者和商務(wù)人士,不僅支持實(shí)時(shí)錄音轉(zhuǎn)文字,還可以完成同傳翻譯、對(duì)話翻譯功能。語音識(shí)別準(zhǔn)確率超過97%,每分鐘400字的轉(zhuǎn)寫速度, 支持分享給朋友和社交平臺(tái)。
準(zhǔn)確,實(shí)現(xiàn),支持,領(lǐng)域的,語言






