數(shù)字尾巴:除了按鍵輸入 手機(jī)輸入法還能做到更多
摘要: 前言:從Symbian時(shí)代到如今的iOS和Android,在手機(jī)上,我們已經(jīng)經(jīng)歷了一次從物理鍵盤到虛擬鍵盤的輪回。
前言:從 Symbian 時(shí)代到如今的 iOS 和 Android,在手機(jī)上,我們已經(jīng)經(jīng)歷了一次從物理鍵盤到虛擬鍵盤的輪回。鍵盤從屏外到屏內(nèi),但手機(jī)輸入法依然還是那個(gè)輸入法,只是它已經(jīng)從單純的文字輸入工具,進(jìn)化成了以文字輸入為核心賣點(diǎn)的「百寶箱」式的 APP。
它不只是能幫你打字,還能幫你搜索、幫你斗圖,甚至幫你翻譯。
有人會(huì)嫌棄說「手機(jī)輸入法變得越來越臃腫了」,但實(shí)際上手機(jī)輸入法的功能變得越來越強(qiáng)大和全面,也是不爭的事實(shí)。輸入法之所以會(huì)向功能全面化進(jìn)化,顯然是離不開中文輸入法這個(gè)大環(huán)境下的激烈競爭。
尤其是搜索巨頭的進(jìn)場,搜狗輸入法、塞班末期借殼點(diǎn)訊的百度輸入法和收購 A4 完成布局的 QQ 輸入法,為了「搜索截流」這個(gè)目標(biāo)布局手機(jī)輸入法市場的搜索巨頭,直接推動(dòng)了輸入法的功能進(jìn)化。
搜索巨頭之所以看中輸入法,是因?yàn)椤篙斎搿故怯脩舯磉_(dá)自我的基礎(chǔ)需求――你可以不使用任何一個(gè)手機(jī) APP,但鍵盤任何人都必不可少――布局輸入法既能為用戶精準(zhǔn)畫像,也能從用戶點(diǎn)擊輸入框的第一時(shí)間,就截取用戶的搜索流量。把輸入法用作一個(gè)可以無視時(shí)間和空間的 Launcher,做搜索引擎的百度、搜狗、騰訊瞄準(zhǔn)輸入法是這個(gè)思路,做 AI 的訊飛瞄準(zhǔn)輸入法,同樣也是這個(gè)思路。只是百度在打字之余位用戶提供了搜索入口,而訊飛為用戶提供了AI。
AI,正是訊飛的拿手好戲
2010 年發(fā)布時(shí),訊飛輸入法更像是專長智能語音和人工智能技術(shù)的科大訊飛(002230)的 to C 先行者,拿出最新的技術(shù)在市場上試錯(cuò)。而在逐漸迭代的過程中,訊飛成長成國內(nèi)用戶增長第一、市場份額次席的手機(jī)輸入法,靠的正是科大訊飛在智能語音和人工智能領(lǐng)域的 20 年沉淀。如果跟熟悉手機(jī)輸入法的手機(jī)用戶提起訊飛,他們的第一印象一定是:語音無敵。
科大訊飛的「智能語音」和「人工智能」,落地在訊飛手機(jī)輸入法上,理所當(dāng)然會(huì)是語音輸入。在聯(lián)網(wǎng)狀態(tài)下,訊飛輸入法目前可以支持除了普通話之外的粵語、閩南語、四川話等 23 種方言,以及英語、日語、韓語、和俄語等外文,甚至中英混輸也能無壓力識別。
這中間涉及到的一系列復(fù)雜的機(jī)器翻譯、自然語言理解、機(jī)器推理、知識發(fā)現(xiàn),而且?guī)缀趺恳环N方言 / 語言基本上都是一套獨(dú)立的語言系統(tǒng),都既需要長時(shí)間的大量機(jī)器學(xué)習(xí)積累,也需要技術(shù)積累。而這恰好是背靠科大訊飛的訊飛輸入法的優(yōu)勢所在。一方面,其背靠有 20 多年智能語音技術(shù)沉淀的科大訊飛,擁有超過 20 萬小時(shí)訓(xùn)練數(shù)據(jù)積累;另一方面,科大訊飛有太多的國際賽事頂尖榮譽(yù),比如2018年的國際權(quán)威英文語音識別大賽“CHiME-6”中,科大訊飛包攬了兩項(xiàng)第一名;2019 年在 ICDAR2019 舉辦的場景文本視覺問答挑戰(zhàn)賽 ST-VQA 中,科大訊飛包攬了三項(xiàng)冠軍。
在 2018 年訊飛輸入法就已實(shí)現(xiàn) 1 分鐘 400 字的高速輸入,而且能夠?qū)⒆R別率保持在 98% 以上。98% 的識別率意味著識別出錯(cuò)的概率會(huì)非常小,而即便是因?yàn)橹饔^或者客觀原因識別出錯(cuò),也可以簡單手輸修改幾個(gè)字詞調(diào)整,易用性相當(dāng)可觀。
要知道,在保證輸入準(zhǔn)確的前提下,我們普通人在手機(jī)上手輸文字的速度大概在每分鐘 60 字以內(nèi),所以訊飛的語音輸入速度,基本上是手動(dòng)輸入的 6 倍左右――這種輸入速度上的碾壓,往往能顯著地提高效率,尤其是在那些需要大量輸入文字的場景里面,比如商務(wù)對接工作。
而且,在手機(jī)大屏化趨勢導(dǎo)致手機(jī)的握持手感和輸入體驗(yàn)都不夠理想的背景下,語音輸入不只是更高效,而且體驗(yàn)也會(huì)更加自然,畢竟,同樣是輸出文字,按住空格鍵「說話」毫無疑問要比抱著手機(jī)「打字」更加自然。
在更開放的 Android 上,訊飛能直接調(diào)起鍵盤錄入語音實(shí)時(shí)轉(zhuǎn)換文字,而不需要在當(dāng)前 APP 和訊飛輸入法的 APP 之間跳轉(zhuǎn),體驗(yàn)非常流暢,邏輯清晰、使用也簡單。而且不管你是習(xí)慣用什么方言,訊飛都能精準(zhǔn)識別,這就非常符合國人的方言眾多、習(xí)慣不一的現(xiàn)實(shí)了。主流的方言,包括粵語、四川話、閩南語、上海話、武漢話等超過 23 種方言,延伸出的藏語、維語 2 種民族語言,都能直接在訊飛里面語音輸入,而不需要從日常的語言氛圍里面切換到普通話之后再語音輸入,消除了體驗(yàn)痛點(diǎn)。
當(dāng)前的語音輸入不可能不出錯(cuò),距離100%準(zhǔn)確最后“一公里”,訊飛輸入法也拿出了解決方案――智能糾錯(cuò)的語音候選詞。實(shí)際體驗(yàn)可以感知,在語音輸入過程中自動(dòng)糾錯(cuò),AI提供了中、英候選建議,大大節(jié)省修改和重輸?shù)臅r(shí)間。
但在訊飛輸入法上,落地科大訊飛智能語音和人工智能技術(shù)的并不只有語音輸入這個(gè)功能,而是鋪開為更廣義的語音轉(zhuǎn)文字、文字識別在內(nèi)的一些列工具性質(zhì)的功能,比如文字掃描、語音便簽、實(shí)時(shí)翻譯。
OCR拍照取字有奇效
在訊飛的工具箱中啟用之后,我們可以直接在 APP 內(nèi)工具欄上直接啟動(dòng)訊飛的 OCR應(yīng)用――也就是文字掃描功能。
OCR 主要涉及到為計(jì)算機(jī)視覺技術(shù)(包括了圖像識別和圖像理解),也是屬于人工智能的主要技術(shù)之一,基于語義分割的文字檢測方案,訊飛輸入法通過在特征圖上對每個(gè)像素進(jìn)行前景和背景的分類,可以實(shí)現(xiàn)任意方向、任意形狀的文本行檢測。得益于此,訊飛輸入法的 OCR 拍照取字的速度和成功率也非??捎^,基本上可以做到立拍即取,而且取字之后還支持后續(xù)的翻譯操作,所以用作出國旅行的實(shí)時(shí)翻譯工具也有奇效。
語音便簽功能實(shí)際上是訊飛輸入法語音輸入的翻版,核心功能仍然是語音轉(zhuǎn)文字,但它不是用作文字輸入而是用作備忘,可以直接把臨時(shí)產(chǎn)生的思考直接轉(zhuǎn)換為文字存儲(chǔ)起來。
實(shí)時(shí)翻譯對大眾而言為剛需中的剛需。輸入法如何讓翻譯更普及,著實(shí)做了有用功。譬如,訊飛輸入法搭載了快捷翻譯(文本翻譯文本)、隨聲譯(語音翻譯文本)以及面對面翻譯(線下場景的語音翻譯文本并支持語音播報(bào))。和線上的「翻譯器」一樣,隨聲譯是通過語音識別 - 翻譯轉(zhuǎn)換實(shí)現(xiàn)實(shí)時(shí)的雙語互譯,目前訊飛輸入法內(nèi)支持的互譯語言包括英、日、韓、俄等多種語言與中文互譯。也就是,說中文譯外文,說外文譯中文,說是語音輸入的加強(qiáng)版也不為過。
輸入,訊飛同樣可圈可點(diǎn)
這些基于智能語音和人工智能的功能,是訊飛輸入法相比其他競品的相對優(yōu)勢,不過作為目前市占率第二的中文輸入法,訊飛的基礎(chǔ)功能――也就是文字輸入,也非常強(qiáng)大。
影響中文輸入法按鍵出字效率的,包括這幾種因素:
1.輸入方式
2.詞庫(包括候選詞)
3.選詞效率
4.輸入輔助
如果分開各項(xiàng)來看,訊飛在分項(xiàng)中即便不是在所有輸入法中沒有做到最好,也至少是處于主流水準(zhǔn),并以肉眼可見的速度提升。
輸入方式,豐富趁手
輸入方式上,以國內(nèi)用戶典型的中文輸入為例,訊飛支持既支持主流鍵位比如 9 宮格拼音、全鍵盤拼音、筆畫、手寫和語音,而且它還可以支持拼音雙鍵這種小眾的鍵位;支持點(diǎn)劃、經(jīng)典布局,或者 iOS 系統(tǒng)布局;支持全拼或者 7 種雙拼、繁簡輸入……
詞庫,助力輸入效率
而至于詞庫,訊飛這種頭部的輸入法都有大量的分類詞庫、同時(shí)支持云輸入,所以專用詞匯以及熱點(diǎn)詞匯的輸入效率都非常高,基本上不會(huì)出現(xiàn)自帶輸入法非常用詞需自造的情況。
選詞效率,智能調(diào)頻
訊飛在候選詞上仍然使用了自己拿手的機(jī)器學(xué)習(xí),在海量數(shù)據(jù)(603138)訓(xùn)練優(yōu)化之后,訊飛能智能預(yù)測用戶的輸入習(xí)慣,結(jié)合字頻詞頻和上文語義,智能調(diào)整候選詞。
輸入輔助,戲也很多
在偏娛樂化的社交場景中,訊飛輸入法還支持輔助輸入一些流行等的表達(dá)方式,比如火星文、刷屏模式、咆哮模式,專門的「BiuBiu 工具」,來收納所有包括 emoji 聊天在內(nèi)的趣味聊天方式,無論你是不是這些聊天方式的受眾,偶爾嘗試一下也會(huì)非常有趣。
所有這些輸入功能,讓訊飛輸入法具備有高效輸入工具的能力,再加上公認(rèn)的強(qiáng)大的語音輸入能力,訊飛至少在中文相關(guān)的輸入場景下,稱得上是輸入效率最高的中文輸入法之一。
當(dāng)然,因?yàn)橛锌拼笥嶏w的智能語音和人工智能技術(shù)的加持,訊飛手機(jī)輸入法不只是一款做得不錯(cuò)的「中文輸入法」,而是一個(gè)以智能語音功能為核心的、加入了大量輸入輔助功能的Launcher,它所能提供的,已經(jīng)遠(yuǎn)超過中文輸入而已。
這款輸入法,遠(yuǎn)不止輸入法。
輸入法,文字








大同市|
洞头县|
枣阳市|
石城县|
天镇县|
突泉县|
榆林市|
马关县|
大余县|
修水县|
唐海县|
宜丰县|
濮阳县|
乌拉特前旗|
临沧市|
正安县|
长丰县|
中江县|
扶沟县|
呼伦贝尔市|
延长县|
浮梁县|
克什克腾旗|
托里县|
德令哈市|
南部县|
探索|
百色市|
南昌县|
芒康县|
兰西县|
綦江县|
天门市|
万全县|
陆河县|
化州市|
宁明县|
双城市|
丰原市|
乡宁县|
科尔|