從語(yǔ)音產(chǎn)業(yè)拓荒者到人工智能國(guó)家隊(duì) 科大訊飛是如何煉成的
摘要: 編者按:《創(chuàng)新100》是搜狐科技在2020年推出的一檔全新深度欄目,關(guān)注科技領(lǐng)域的創(chuàng)新,主要圍繞人工智能、5G、大數(shù)據(jù)、芯片等技術(shù)創(chuàng)新,以及新零售、在線健身、云辦公等商業(yè)模式創(chuàng)新。
編者按:《創(chuàng)新100》是搜狐科技在2020年推出的一檔全新深度欄目,關(guān)注科技領(lǐng)域的創(chuàng)新,主要圍繞人工智能、5G、大數(shù)據(jù)、芯片等技術(shù)創(chuàng)新,以及新零售、在線健身、云辦公等商業(yè)模式創(chuàng)新。
《創(chuàng)新100》將通過(guò)可視化的數(shù)據(jù)榜單、深度視頻訪談、系列選題策劃等內(nèi)容形式,同時(shí),結(jié)合即將舉辦的線下大型活動(dòng),聚焦最有科技力、創(chuàng)新力的百家公司。
【創(chuàng)新評(píng)析】
成立二十多年,科大訊飛(002230)從中國(guó)語(yǔ)音產(chǎn)業(yè)拓荒者,最終成為行業(yè)領(lǐng)軍者,也是首批人工智能國(guó)家隊(duì),位居中國(guó)智能語(yǔ)音行業(yè)老大的地位。2019年科大訊飛營(yíng)收首次突破百億,同時(shí)實(shí)現(xiàn)人工智能戰(zhàn)略從1.0到 2.0階段的跨越,開(kāi)啟了新的商業(yè)化征程。

技術(shù)方面,科大訊飛堅(jiān)持“頂天”策略,深耕語(yǔ)音領(lǐng)域,構(gòu)建擁有自主知識(shí)產(chǎn)權(quán)的技術(shù)體系。目前,科大訊飛以感知智能+認(rèn)知智能為兩大研究方向,在語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)音評(píng)測(cè)、圖文識(shí)別、機(jī)器翻譯等多項(xiàng)核心技術(shù)方面走在前列,在國(guó)際賽事中獲得近30項(xiàng)冠軍。
商業(yè)模式方面,科大訊飛確立“立地”策略,堅(jiān)持聚焦剛需賽道,基本形成2B+2C雙輪驅(qū)動(dòng)的模式,成為業(yè)內(nèi)少有的同時(shí)布局兩端業(yè)務(wù)的AI企業(yè)。物聯(lián)網(wǎng)給AI帶來(lái)更大的想象力,而科大訊飛也在積極搭建生態(tài),力圖在未來(lái)的市場(chǎng)中獲得更強(qiáng)的核心競(jìng)爭(zhēng)力。
提到1999年,人們想到最多的是如今統(tǒng)治中國(guó)互聯(lián)網(wǎng)江湖的BAT,他們都在這一年成立,阿里十八羅漢的創(chuàng)業(yè)故事更是為后人津津樂(lè)道。但這一年,還有一家遠(yuǎn)離互聯(lián)網(wǎng)中心的公司落地——合肥的硅谷天音,也就是科大訊飛的前身,一家脫胎于中科大實(shí)驗(yàn)室的創(chuàng)業(yè)團(tuán)隊(duì),同樣是十八個(gè)人的班底,帶頭的是當(dāng)時(shí)尚在中科大深造的劉慶峰。
他們選擇的創(chuàng)業(yè)方向是當(dāng)時(shí)看起來(lái)并不熱門且國(guó)內(nèi)市場(chǎng)基本被國(guó)際IT巨頭壟斷的語(yǔ)音領(lǐng)域??拼笥嶏w扛起自主研發(fā)的大旗,一家從民房里走出來(lái)的“草臺(tái)班子”最終成長(zhǎng)為人工智能國(guó)家隊(duì)。
同時(shí),科大訊飛也完成從技術(shù)到商業(yè)、從實(shí)驗(yàn)室到市場(chǎng)的蛻變,蹚出了一條2B+2C兩條腿走路的商業(yè)化路徑。對(duì)于當(dāng)下的AI行業(yè)來(lái)說(shuō),科大訊飛無(wú)疑提供了一個(gè)技術(shù)商業(yè)化路徑的樣本。
“一路走來(lái),我們都是用技術(shù)頂天產(chǎn)業(yè)立地的方式來(lái)帶動(dòng)整個(gè)行業(yè)的發(fā)展,很多人在模仿我們,但我們從來(lái)沒(méi)有被超越。” 在本月初的新品發(fā)布會(huì)上,科大訊飛輪值總裁胡郁說(shuō)到。
不過(guò),相較于當(dāng)下人們對(duì)AI的追捧和想象,20多年前人工智能才剛剛從低谷中走出。1997年,IBM的計(jì)算機(jī)系統(tǒng)“深藍(lán)”戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅夫,再次引發(fā)行業(yè)關(guān)注。科大訊飛由此踏上人工智能的第三波浪潮,并實(shí)現(xiàn)了人工智能戰(zhàn)略的跨越。
但在被美國(guó)列入“實(shí)體清單”、國(guó)內(nèi)外互聯(lián)網(wǎng)科技巨頭又紛紛布局AI賽道的競(jìng)爭(zhēng)情況下,科大訊飛又該如何繼續(xù)實(shí)現(xiàn)“用人工智能建設(shè)美好世界”的使命?
實(shí)驗(yàn)室走出的團(tuán)隊(duì)
科大訊飛的創(chuàng)業(yè)經(jīng)歷,是個(gè)典型的中國(guó)技術(shù)創(chuàng)業(yè)故事。2000年前,中文語(yǔ)音幾乎為國(guó)外公司壟斷,微軟、IBM等國(guó)際知名企業(yè)紛紛在國(guó)內(nèi)建立中文研究院。
彼時(shí)中國(guó)的語(yǔ)音技術(shù)研究多還停留在實(shí)驗(yàn)室階段,科大訊飛的成立就離不開(kāi)中科大電子工程系的“人機(jī)語(yǔ)音通信實(shí)驗(yàn)室”。當(dāng)時(shí)該實(shí)驗(yàn)室的導(dǎo)師是中國(guó)語(yǔ)音界泰斗級(jí)教授王仁華,劉慶峰本科時(shí)就加入這個(gè)實(shí)驗(yàn)室搞研究。
1998年劉慶峰牽頭的中科大團(tuán)隊(duì)在國(guó)家863計(jì)劃支持的語(yǔ)音合成技術(shù)項(xiàng)目上奪冠,其在該項(xiàng)目的評(píng)測(cè)被專家組認(rèn)定為初步達(dá)到實(shí)用化水平。這讓劉慶峰產(chǎn)生了將研究成果產(chǎn)業(yè)化的想法,為此他還拒絕了微軟獎(jiǎng)學(xué)金。
于是,剛從中科大研究生畢業(yè)的劉慶峰加入了創(chuàng)業(yè)浪潮,還拉上中科大實(shí)驗(yàn)室的同門師兄弟,搭建起18人的班底,在租來(lái)的民居里于1999年4月成立硅谷天音,年底則更名為科大訊飛,后來(lái)其還獲得聯(lián)想和復(fù)星的投資。
語(yǔ)音是典型的交叉科學(xué),涉及到聲學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)工程處理等多領(lǐng)域,和人工智能一樣,屬于技術(shù)先導(dǎo)型產(chǎn)業(yè)。如何在被巨頭壟斷的市場(chǎng)中搶得發(fā)展機(jī)遇?科大訊飛的做法是通過(guò)自主創(chuàng)新實(shí)現(xiàn)技術(shù)突破,構(gòu)建源頭技術(shù)壁壘。
“只有依靠創(chuàng)新實(shí)現(xiàn)核心技術(shù)領(lǐng)先,才有可能在激烈的競(jìng)爭(zhēng)中立足、生存、發(fā)展。”劉慶峰曾在接受媒體采訪時(shí)表示,創(chuàng)新就是科大訊飛的生命線。在All in語(yǔ)音技術(shù),坐了多年冷板凳后,科大訊飛從中國(guó)語(yǔ)音產(chǎn)業(yè)的拓荒者最終成為領(lǐng)軍者。
2014年科大訊飛又啟動(dòng)針對(duì)高級(jí)人工智能的“訊飛超腦”計(jì)劃,并形成以感知智能+認(rèn)知智能兩大研發(fā)方向,在語(yǔ)音合成、語(yǔ)音識(shí)別、語(yǔ)音評(píng)測(cè)、圖文識(shí)別、醫(yī)學(xué)影像、機(jī)器翻譯、自然語(yǔ)言理解等多個(gè)自主研發(fā)的核心技術(shù)方面,實(shí)現(xiàn)了對(duì)人類水平的多次超越。
據(jù)科大訊飛輪值總裁胡郁介紹,科大訊飛在國(guó)際賽事上共獲得28項(xiàng)世界冠軍,并連續(xù)兩年入選《MIT科技評(píng)論》 “全球最聰明50家公司”榜單,公司語(yǔ)音轉(zhuǎn)寫識(shí)別正確率達(dá)到98%。2017年科大訊飛還作為智能語(yǔ)音領(lǐng)域代表和百度、阿里云、騰訊成為首批國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái),并主持和參與制定多項(xiàng)國(guó)家/國(guó)際標(biāo)準(zhǔn)。
這離不開(kāi)對(duì)研發(fā)的重視。近年來(lái),科大訊飛的技術(shù)團(tuán)隊(duì)規(guī)模穩(wěn)定占比在60%以上,研發(fā)投入占營(yíng)收比也保持在20%以上,公司也牢牢占據(jù)國(guó)內(nèi)智能語(yǔ)音市場(chǎng)老大的地位。數(shù)據(jù)顯示,科大訊飛在中文語(yǔ)音市場(chǎng)占有率達(dá)44.2%,比百度、蘋果等后四位市場(chǎng)份額之和還要略高,同時(shí)在多個(gè)重要細(xì)分領(lǐng)域市占率超過(guò)60%。
“我們一直堅(jiān)持做源頭核心技術(shù)的自主創(chuàng)新,去年10月8號(hào)也被列入實(shí)體清單?!焙粼谠鲁醯男缕钒l(fā)布會(huì)上稱。據(jù)了解,在被列入“實(shí)體清單”后,科大訊飛迅速切換到以國(guó)產(chǎn)供應(yīng)鏈為主的非美供應(yīng)鏈體系,加之擁有自主知識(shí)產(chǎn)權(quán)的核心技術(shù),公司業(yè)務(wù)運(yùn)營(yíng)未受到重大影響。
不過(guò),伴隨著人工智能技術(shù)門檻的降低,核心技術(shù)領(lǐng)先的窗口期也在逐步縮短,這是所有企業(yè)都需克服的問(wèn)題。科大訊飛副總裁李傳剛在接受搜狐科技采訪時(shí)認(rèn)為,既要堅(jiān)持源頭核心技術(shù)創(chuàng)新,又要保持對(duì)外部技術(shù)的敏銳嗅覺(jué),設(shè)定合理的技術(shù)臺(tái)階,保持多個(gè)不同技術(shù)方向間的充分溝通和信息流的傳播,盡可能實(shí)現(xiàn)某項(xiàng)技術(shù)進(jìn)步帶來(lái)的“放大器效應(yīng)”,這些都可以增強(qiáng)壁壘。
科大訊飛也在做這樣的嘗試。李傳剛表示,在現(xiàn)有技術(shù)基礎(chǔ)上,科大訊飛還會(huì)充分利用語(yǔ)音、圖像等多模態(tài)信息的互補(bǔ)作用,結(jié)合場(chǎng)景需求研究多類技術(shù)的方式,提升實(shí)際場(chǎng)景下識(shí)別等感知能力的可用性,拓寬技術(shù)的應(yīng)用領(lǐng)域。
2B+2C兩條腿走路
隨著2016年AlphaGo戰(zhàn)勝世界圍棋冠軍李世石,人工智能第三波浪潮迎來(lái)高潮。然而潮水過(guò)后,如何實(shí)現(xiàn)規(guī)?;瘧?yīng)用成為AI行業(yè)面臨的普遍問(wèn)題。
這是技術(shù)先導(dǎo)性企業(yè)打通最后一公里最為關(guān)鍵的問(wèn)題,而這也曾是困擾科大訊飛的問(wèn)題。創(chuàng)立初期,科大訊飛定位于大眾消費(fèi)市場(chǎng),并在2000年推出一款針對(duì)PC的智能語(yǔ)音軟件“暢言2000”。但由于當(dāng)時(shí)盜版猖獗,PC普及率較低,C端用戶教育和售后服務(wù)成本高,科大訊飛這一嘗試失敗。
科大訊飛迅速調(diào)整,幸運(yùn)的是,其語(yǔ)音合成系統(tǒng)引起了華為的注意,并最終拿下華為訂單,中興、聯(lián)想等后來(lái)也成為其客戶。科大訊飛由此發(fā)展出最初成型的商業(yè)模式——“iFLY-inside”,即2B模式的一種,基于核心技術(shù),向開(kāi)發(fā)商提供語(yǔ)音支持軟件服務(wù)。
然而,科大訊飛很快發(fā)現(xiàn),這種模式存在利潤(rùn)空間低,且無(wú)法直接觸達(dá)終端用戶,難以對(duì)系統(tǒng)進(jìn)行升級(jí)優(yōu)化等短板??拼笥嶏w再次探索,最終選擇直接面向行業(yè)終端,提供語(yǔ)音技術(shù)應(yīng)用解決方案,并成為公司核心發(fā)展模式。隨著2B領(lǐng)域做大做強(qiáng),科大訊飛在2008年實(shí)現(xiàn)上市,隨后其又開(kāi)始踏足2C市場(chǎng)。
目前,科大訊飛基本形成2B+2C雙輪驅(qū)動(dòng)、軟硬件齊頭并進(jìn)的業(yè)務(wù)模式,去年公司營(yíng)收首次突破百億,其中2B業(yè)務(wù)貢獻(xiàn)64%收入,其集中在教育、醫(yī)療、政法、汽車、智慧城市、智能客服等領(lǐng)域。
2C方面,科大訊飛在2010年先后推出訊飛輸入法、訊飛語(yǔ)記、訊飛聽(tīng)見(jiàn)等軟件,在2016年整合消費(fèi)者事業(yè)群后,又發(fā)布了音箱、錄音筆、翻譯機(jī)、辦公本等多款智能硬件產(chǎn)品。這個(gè)月初,科大訊飛還發(fā)布了三款智能錄音筆,并推出了首款智能TWS耳機(jī)iFLYBUDS,進(jìn)一步豐富了辦公市場(chǎng)需求。
系列產(chǎn)品的發(fā)布推動(dòng)了2C業(yè)務(wù)的快速增長(zhǎng)。從2017年到2019年,科大訊飛消費(fèi)者業(yè)務(wù)從6億收入、3億毛利增長(zhǎng)到30多億收入、15億毛利,胡郁預(yù)計(jì)今年還會(huì)持續(xù)增長(zhǎng)。去年2C業(yè)務(wù)占比已接近36%,今年上半年提升至38%,基本完成科大訊飛三年前提出的占比四成的目標(biāo)。
從2C到2B,再到2B和2C雙輪驅(qū)動(dòng),科大訊飛在跌跌撞撞中闖出了一條“彎曲的直線”,其也成為業(yè)內(nèi)少有的同時(shí)布局兩端的AI企業(yè),其他AI企業(yè)多數(shù)聚焦于2B賽道。
李傳剛認(rèn)為,多數(shù)AI企業(yè)首先落地B端,主要是因?yàn)槭袌?chǎng),技術(shù)應(yīng)用早期價(jià)格比較昂貴,個(gè)人消費(fèi)者缺乏消費(fèi)習(xí)慣。而科大訊飛能夠?qū)崿F(xiàn)兩端布局,得益于自身的一套邏輯。在AI落地時(shí),必須有具體實(shí)戰(zhàn)案例,能解決用戶剛需;案例可以規(guī)?;茝V,產(chǎn)生規(guī)?;б?;應(yīng)用AI以后,能有統(tǒng)計(jì)數(shù)據(jù)證明具體成效。
基于這樣的標(biāo)準(zhǔn),科大訊飛人工智能戰(zhàn)略也實(shí)現(xiàn)升級(jí),其在2019年宣布公司從“人工智能1.0階段”進(jìn)入“2.0階段”?!霸?.0時(shí)代,注重的是核心技術(shù)的突破,如突破語(yǔ)音識(shí)別、語(yǔ)言處理和翻譯技術(shù);2.0時(shí)代強(qiáng)調(diào)應(yīng)用落地,以及思考在智能物聯(lián)網(wǎng)時(shí)代如何去構(gòu)建新的商業(yè)生態(tài)?!崩顐鲃偨忉尫Q。
至于到底要做一家2B還是2C的公司,對(duì)科大訊飛來(lái)說(shuō)已不重要?!叭斯ぶ悄芪磥?lái)會(huì)立足于應(yīng)用場(chǎng)景驅(qū)動(dòng)而不斷落地,實(shí)實(shí)在在解決剛需。長(zhǎng)遠(yuǎn)來(lái)看,無(wú)論是2B還是2C,我們希望做一家能夠解決用戶剛需的公司?!?李傳剛表示。
物聯(lián)網(wǎng)時(shí)代的新競(jìng)爭(zhēng)
作為智能語(yǔ)音與人工智能領(lǐng)域的代表性企業(yè),科大訊飛也必然面臨來(lái)自國(guó)內(nèi)外巨頭的挑戰(zhàn)。如何應(yīng)對(duì)行業(yè)競(jìng)爭(zhēng)?
除了構(gòu)建技術(shù)壁壘,更為重要的是搭建生態(tài),這也越發(fā)成為業(yè)內(nèi)共識(shí)。科大訊飛也認(rèn)識(shí)到,人工智能的競(jìng)爭(zhēng)不是單個(gè)企業(yè)的競(jìng)爭(zhēng),而是一個(gè)產(chǎn)業(yè)鏈對(duì)一個(gè)產(chǎn)業(yè)鏈的競(jìng)爭(zhēng)、一個(gè)體系對(duì)一個(gè)體系的競(jìng)爭(zhēng),是生態(tài)的競(jìng)爭(zhēng)。
因此在應(yīng)用賽道之外,科大訊飛確定了平臺(tái)戰(zhàn)略。2010年科大訊飛首家上線人工智能開(kāi)放平臺(tái),通過(guò)技術(shù)賦能、市場(chǎng)賦能和投資賦能,持續(xù)為移動(dòng)互聯(lián)網(wǎng)、創(chuàng)業(yè)開(kāi)發(fā)者和用戶提供人工智能開(kāi)發(fā)與服務(wù)能力,圍繞人工智能開(kāi)放平臺(tái)構(gòu)建產(chǎn)業(yè)生態(tài)。
胡郁認(rèn)為,智能語(yǔ)音和人工智能不僅僅是科大訊飛強(qiáng)大的技術(shù)支撐,最重要的是還要面向整個(gè)行業(yè)?!坝写罅扛鞣N各樣的應(yīng)用需要人工智能技術(shù),但并不是每家公司、每個(gè)開(kāi)發(fā)團(tuán)隊(duì)都需要把人工智能技術(shù)自己做出來(lái)。”他如此解釋科大訊飛開(kāi)放平臺(tái)的原因。
目前,訊飛開(kāi)放平臺(tái)已對(duì)外開(kāi)放超過(guò)300項(xiàng) AI 能力及方案,連接超200萬(wàn)生態(tài)合作伙伴,開(kāi)發(fā)者團(tuán)隊(duì)數(shù)量從2017年的53萬(wàn)個(gè)已增長(zhǎng)至今年8月底的 142萬(wàn)個(gè),連接終端從17億臺(tái)增長(zhǎng)到今年的29億臺(tái),形成了從源頭技術(shù)創(chuàng)新到產(chǎn)業(yè)技術(shù)創(chuàng)新的全生態(tài)創(chuàng)新體系。
同時(shí),隨著物聯(lián)網(wǎng)時(shí)代到來(lái),人機(jī)交互的價(jià)值也日趨重要,而語(yǔ)音將成為重要入口。科大訊飛2015年發(fā)布新一代人機(jī)智能交互開(kāi)放平臺(tái)發(fā)布AIUI,目前已進(jìn)階至3.0版本,并不斷完善技能開(kāi)發(fā)工具和平臺(tái)能力,與行業(yè)共享共建。
未來(lái)的智能不僅只是實(shí)現(xiàn)人機(jī)交互,還是設(shè)備間的互通互聯(lián)。胡郁認(rèn)為,智能硬件的發(fā)展將對(duì)整個(gè)語(yǔ)音交互會(huì)帶來(lái)非常高的使用需求,但做硬件需做好長(zhǎng)期投入準(zhǔn)備。科大訊飛除了堅(jiān)持硬件策略,也推出智能物聯(lián)云AIoT,通過(guò)傳感器和終端設(shè)備連接用戶和開(kāi)發(fā)者,建立完整的物聯(lián)網(wǎng)智能消費(fèi)場(chǎng)景,助力人工智能向應(yīng)用智能發(fā)展。
“未來(lái)不管是我們和人工智能,還是和機(jī)器人之間,都應(yīng)該是自然的交互。如智能汽車、智能家居等,都能和你進(jìn)行對(duì)話和交流,并能夠理解你所講的話,從而提供服務(wù)?!边@是胡郁暢想的語(yǔ)音交互的未來(lái)。不過(guò)他認(rèn)為,目前語(yǔ)音交互還沒(méi)有成為主流,大概還要5-10年。
這將為科大訊飛搶占物聯(lián)網(wǎng)新機(jī)遇創(chuàng)造時(shí)間窗口。在致力于推動(dòng)機(jī)器能聽(tīng)會(huì)說(shuō),能理解會(huì)思考,用人工智能建設(shè)美好世界的使命之旅上,科大訊飛已行至中途,未來(lái)還將有更多可能,同時(shí)也將面臨更大競(jìng)爭(zhēng)與更多挑戰(zhàn)。
科大訊飛,人工智能








平遥县|
耿马|
棋牌|
文安县|
象州县|
巫山县|
山阳县|
即墨市|
根河市|
新闻|
周至县|
万州区|
兴宁市|
全南县|
电白县|
景谷|
老河口市|
北海市|
土默特左旗|
文山县|
汪清县|
白银市|
洪洞县|
呈贡县|
南宫市|
阿尔山市|
金阳县|
忻州市|
葫芦岛市|
屏山县|
宁蒗|
稷山县|
化州市|
米林县|
凤冈县|
天柱县|
贡嘎县|
阿巴嘎旗|
横山县|
习水县|
长垣县|