發(fā)表評論分享按鈕

手機(jī)語音搜索亟待突破中文識別技術(shù)瓶頸

2012/02/21

  “娛樂式嘗鮮”利于產(chǎn)品升級改進(jìn)

  在手機(jī)語音搜索這一年度移動互聯(lián)網(wǎng)熱點領(lǐng)域,蘋果公司依舊是先行者。此前,蘋果公司推出了iPhone 4S,并在其中集成了Siri模塊——這使得用戶可以通過語音對手機(jī)進(jìn)行控制,同時也可以通過語音進(jìn)行搜索。蘋果公司巨大的行業(yè)示范效應(yīng)使得手機(jī)語音搜索的市場被引爆,各類語音搜索的應(yīng)用迅速涌現(xiàn)。

  近日,HTC旗艦級新機(jī)HTC Endeavour被曝出包含了一項名為“HTC Speak”的語音助理軟件;國內(nèi)熱門移動互聯(lián)網(wǎng)應(yīng)用訂餐小秘書也推出了支持語音搜索餐廳功能的Android版及iPhone版客戶端。此前,百度、谷歌、騰訊、UC、科大訊飛等都陸續(xù)推出了自有移動語音搜索應(yīng)用,一時間語音搜索似乎成為了未來智能終端的必備選項。

  事實上,與國外不同,目前國內(nèi)手機(jī)語音搜索市場雖然已具備了一定的用戶需求與初步的技術(shù)積累,但仍處在市場導(dǎo)入期階段。由于目前的技術(shù)現(xiàn)狀無法準(zhǔn)確識別國內(nèi)用戶相關(guān)需求,用戶多將其作為嘗鮮的娛樂工具而非應(yīng)用工具,可以看到,我國手機(jī)語音搜索應(yīng)用從起步到成熟仍將有較長的路要走。

  Siri成功培養(yǎng)用戶習(xí)慣

  雖未被廣泛普及,但目前國內(nèi)手機(jī)語音搜索的市場發(fā)展基礎(chǔ)已經(jīng)形成。

  首先,手機(jī)語音搜索迎合國內(nèi)手機(jī)用戶需求。用戶在使用手機(jī)時,有相當(dāng)比例的時間處在移動狀態(tài)下,在這種狀態(tài)下,用戶視覺的使用需要在使用手機(jī)與其它行為(如觀察路況等)間進(jìn)行分配,因而無法專注地使用手機(jī)。而語音搜索則解決了這一問題,用戶可以通過“說”來提交需求,通過“聽”來獲得反饋,而不會影響用戶正常行為。

  其次,Siri成功引發(fā)了用戶語音搜索使用興趣,國內(nèi)手機(jī)語音搜索市場發(fā)展的引爆點已經(jīng)出現(xiàn)。在過去十多年中,蘋果公司一直作為行業(yè)引領(lǐng)者而存在,每當(dāng)其推出了新產(chǎn)品、新應(yīng)用后,用戶對其高度認(rèn)可,并將其作為流行趨勢來對待,而市場上也隨之會出現(xiàn)一系列的“借鑒者”,在產(chǎn)品的外觀、功能等諸多方面進(jìn)行借鑒?梢钥吹,當(dāng)Siri被集成到iPhone 4S中后,在其它各類應(yīng)用市場上,迅速出現(xiàn)了上百種與語音相關(guān)的應(yīng)用,并且凡是涉及到搜索的(包括搜索引擎以及各類應(yīng)用中所涉及到的搜索功能),也無一例外地加上了語音搜索模塊。

  第三,中文語音搜索的技術(shù)基礎(chǔ)已初步形成。語音搜索并非蘋果公司所獨創(chuàng),核心技術(shù)也并非完全掌握在蘋果公司處,這就使得語音搜索的廣泛應(yīng)用成為可能。語音搜索從技術(shù)本質(zhì)而言,是先對用戶所說的語句進(jìn)行語音識別,再根據(jù)識別的結(jié)果進(jìn)行搜索,并反饋用戶相應(yīng)結(jié)果。目前,科大訊飛、谷歌等企業(yè)歷經(jīng)多年的發(fā)展,通過語音庫、語義庫的構(gòu)建,已經(jīng)能夠較好地識別用戶的語音;而語義庫的構(gòu)建,也實現(xiàn)了機(jī)器對人自然語言的解讀,為更加精確反饋搜索結(jié)果奠定了基礎(chǔ)。同時,移動互聯(lián)網(wǎng)與云計算的發(fā)展,也使得基于在線龐大語音、語義庫,實現(xiàn)精準(zhǔn)識別成為可能。

  中文識別難上加難

  盡管手機(jī)語音搜索市場基礎(chǔ)已經(jīng)形成,但是短期內(nèi)市場無法規(guī)模推廣,其根本原因在于目前技術(shù)仍不成熟。

  眾所周知,每個人的口音均有一定的差別,能夠準(zhǔn)確識別用戶在說什么,本身就是一件很困難的事,而中文的同音不同字情況較多,將用戶的語句識別為哪些詞組,還需要考慮上下文的具體情況,相比英文、德文等拉丁語系的一個發(fā)音明確對應(yīng)一個單詞而言,中文的識別難度無疑會更高。同時,在中文中,同樣的一句話,在不同的語境中,具備了不同的含義,識別難度會更大,很難實現(xiàn)以自然語言進(jìn)行搜索,并準(zhǔn)確反饋搜索結(jié)果。

  此外,為了調(diào)用語音、語義庫,以更加精準(zhǔn)地理解用戶的意思,目前不少語音搜索服務(wù)商的做法是將用戶所說的語音上傳到服務(wù)器,由服務(wù)器進(jìn)行識別,但這對網(wǎng)絡(luò)的速度、服務(wù)器的處理能力等提出了較高的要求。

  筆者曾對目前較為流行的谷歌語音搜索應(yīng)用進(jìn)行測試,發(fā)現(xiàn)其對標(biāo)準(zhǔn)普通話的理解尚可,但如果發(fā)音稍不準(zhǔn)確或者出現(xiàn)一些較為冷僻的詞匯,則識別準(zhǔn)確度就會出現(xiàn)明顯下降,需要手工調(diào)整;同時,在光纖接入的Wi-Fi環(huán)境下,識別一句完整的話也需要數(shù)十秒的等待時間。

  音調(diào)類搜索或密集涌現(xiàn)

  從長期發(fā)展趨勢上看,當(dāng)語音搜索技術(shù)達(dá)到成熟時,手機(jī)將成為用戶的智能助理,用戶可以用自然語言向手機(jī)發(fā)出命令,手機(jī)快速完成用戶的請求,包括執(zhí)行相關(guān)應(yīng)用、反饋相關(guān)信息等,而目前的應(yīng)用如Siri,雖然具備了相應(yīng)的理念,但尚不能完全實現(xiàn)相應(yīng)的功能,特別是基于中文的應(yīng)用。

  為了推動手機(jī)語音搜索產(chǎn)品加速步入成熟階段,在現(xiàn)階段,將有諸多廠商,按照手機(jī)語音搜索成熟階段的理念提供相應(yīng)產(chǎn)品,并不斷優(yōu)化。這些產(chǎn)品主要包括手機(jī)輸入法、搜索框的輸入、手機(jī)語音應(yīng)用等。它們在初期或許并不成熟,用戶需要努力用標(biāo)準(zhǔn)的普通話發(fā)音,而不能用自己所常使用的說話方式,并且未必能夠得到精確的反饋結(jié)果,因此,此類產(chǎn)品往往被用戶嘗鮮式使用,并被當(dāng)作一種娛樂工具而非應(yīng)用工具,但是,在產(chǎn)品被用戶使用的過程中,廠商能夠不斷采集用戶的聲音、用戶語言,從而形成較為完善的語音庫、語義庫,使得產(chǎn)品能夠逐步趨向成熟。

  同時,手機(jī)語音搜索的另一個發(fā)展方向是音調(diào)搜索,例如用戶想搜索一首音樂,但他只能記得部分的聲音片段,如果他能夠哼唱出音調(diào),那么搜索工具同樣能夠支持搜索。預(yù)計在未來,此類產(chǎn)品將不斷涌現(xiàn)。

  總之,審視手機(jī)語音搜索的商業(yè)模式,筆者認(rèn)為其不能構(gòu)建獨立的商業(yè)模式,而將更多作為一種技術(shù)手段,支撐其它各類型應(yīng)用更好地發(fā)展,并且在不斷的信息搜集中,實現(xiàn)ICT產(chǎn)業(yè)的重要發(fā)展目標(biāo)之一,即人工智能的深入突破。

通信世界周刊



相關(guān)閱讀:
華為與芒果網(wǎng)合推最新應(yīng)用軟件“勢力邦” 2012-02-21
盛大語音平臺為開發(fā)者插上聲音的翅膀 2012-02-17
智能手機(jī)安全堪憂 安卓平臺危險最大 2012-02-15
全球智能手機(jī)銷量首超PC 移動互聯(lián)網(wǎng)引發(fā)跨界風(fēng) 2012-02-15
LinkedIn移動領(lǐng)域發(fā)展迅速 欲將廣告植入應(yīng)用 2012-02-10

熱點專題:  移動互聯(lián)網(wǎng)

瑞金市| 秦安县| 泰兴市| 五华县| 定结县| 寿光市| 图木舒克市| 清水河县| 漳州市| 平乐县| 肃北| 武宁县| 井研县| 辉县市| 上栗县| 四平市| 衡阳县| 平凉市| 西安市| 阜平县| 公主岭市| 长顺县| 浦县| 临猗县| 兴和县| 平阳县| 娄烦县| 磐安县| 新绛县| 略阳县| 越西县| 泗阳县| 米易县| 犍为县| 呼图壁县| 安塞县| 武功县| 蓬莱市| 黄大仙区| 六枝特区| 屯留县|