整個語音行業(yè)從2010年蘋果公司推出siri開始,受到越來越多的關(guān)注。越來越多的業(yè)內(nèi)人士認(rèn)為,語音技術(shù)在兩三年內(nèi),會徹底改變當(dāng)前的人機(jī)交互方式。北美最大的語音技術(shù)提供商nuance的高管最近就說:“語音和自然語義理解突然成為一門前沿科技,而我們正站在這個過渡點(diǎn)上。我認(rèn)為語音識別將真正顛覆目前的計算機(jī)交互接口。”本文圍繞智能語音在智能交通、智能電網(wǎng)以及智能家居中的應(yīng)用展開探討。
智能語音技術(shù)改變傳統(tǒng)交互方式
智能語音交互首先改變的是移動互聯(lián)網(wǎng)。以iphone中內(nèi)置的siri為例,用戶以自然語言的方式對智能手機(jī)下達(dá)指令,而手機(jī)根據(jù)用戶語音和用戶當(dāng)前的環(huán)境及上下文對用戶意圖進(jìn)行理解,并按照用戶意圖執(zhí)行命令的過程。如用戶說“查找附近的川菜館”,則手機(jī)會搜索用戶當(dāng)前所在位置附近的川菜風(fēng)味餐廳,并將列表顯示出來供用戶選擇查看。
如今的語音搜索不同于傳統(tǒng)搜索模式,不是基于無關(guān)聯(lián)的幾個關(guān)鍵詞來反饋結(jié)果,而是能夠理解用戶指令,完成一項(xiàng)完整的任務(wù)。也就是說,語音搜索已經(jīng)不僅局限于將客戶需要的信息呈現(xiàn)出來,還會將一些連鎖信息進(jìn)行反饋,自動生成給客戶一套全面的服務(wù),基于這種高智能化的技術(shù)進(jìn)化,語音必將成為日后移動互聯(lián)網(wǎng)的入口之一。
電視和機(jī)頂盒也是采用智能語音交互比較積極的行業(yè)。傳統(tǒng)的電視機(jī)和機(jī)頂盒的遙控操作都比較復(fù)雜,而采用智能語音交互技術(shù),只需對著遙控器說話,就可以控制電視,輸入文字、打開應(yīng)用、播放視頻都可輕松實(shí)現(xiàn)。去年三星、lg和聯(lián)想等都發(fā)布了帶有專用語音輸入功能的遙控器,甚至有的還實(shí)現(xiàn)了類似siri的語音助手的功能。
傳統(tǒng)行業(yè)利用智能語音交互技術(shù)進(jìn)行業(yè)務(wù)效率提升的意愿也比較強(qiáng)烈。比如傳統(tǒng)呼叫中心領(lǐng)域,需要投入大量資金、人力,甚至建設(shè)大面積的人工語音座席,每年投入上百億資金。國外早已普遍采用基于智能語音交互技術(shù)改造的呼叫中心,大量的用戶常見問題、投訴和建議都可以被自動識別和回復(fù),節(jié)省了成本。而且這些呼叫中心每天收到大量的用戶語音數(shù)據(jù),包含了龐大數(shù)量的用戶信息、偏好,都具有極大價值。但是如果不能利用智能語音技術(shù)進(jìn)行數(shù)據(jù)處理和挖掘,這些信息就如同儲量龐大的金礦,卻無法開采。為了開發(fā)這些數(shù)據(jù),傳統(tǒng)呼叫中心都對投入智能語音交互技術(shù)抱有極大熱情。
另外,汽車、玩具、穿戴設(shè)備都對智能交互技術(shù)能提供的全新交互方式抱有很大的期待。語音技術(shù)作為一個已經(jīng)漸漸成熟的基礎(chǔ)技術(shù),隨著使用面日漸擴(kuò)大,必將越來越改變傳統(tǒng)的人機(jī)交互方式。
智能交通語音技術(shù)應(yīng)用
定位服務(wù)又叫做移動位置服務(wù)(locationbasedservice,lbs),它是通過電信移動運(yùn)營商的網(wǎng)絡(luò)(如gsm網(wǎng)、cdma網(wǎng))獲取移動終端用戶的位置信息,為用戶提供相應(yīng)的位置服務(wù)。簡單的說,就是你走到某個地方,就可以獲得這里周邊的各類資料,不管是餐廳商廈還是便利店,一切資料盡在掌握。
基于智能語音技術(shù)的lbs系統(tǒng),用戶通過語音就可以便捷的找到想要的定點(diǎn)信息,如附近餐館、咖啡廳、停車場、商貿(mào)中心或旅游景點(diǎn)等,系統(tǒng)借助語音識別技術(shù)識別用戶的需求,并按照距離用戶當(dāng)前位置的遠(yuǎn)近,搜索到滿足要求的定點(diǎn)信息詳細(xì)情況,并通過語音合成系統(tǒng)將相關(guān)信息播報給用戶。
有些用戶,特別是經(jīng)常往返于固定線路的用戶,可以在指定時間定制交通堵塞、交通事故、新建道路、道路施工、氣候變化及停車位等信息,當(dāng)車輛行駛至該路線時給予相關(guān)動態(tài)交通信息的語音提示。當(dāng)然,用戶也可以通過數(shù)據(jù)庫中心(或服務(wù)熱線)查詢指定線路的交通狀態(tài)信息。基于語音識別技術(shù),數(shù)據(jù)庫中心(或服務(wù)熱線)能自動解答用戶所需要的實(shí)時交通信息,幫助用戶及時到達(dá)目的地。
智能語音控制技術(shù)發(fā)力智能電網(wǎng)
對于出租車、公共汽車、高級公路客運(yùn)、長距離貨運(yùn)、物流配送等運(yùn)輸車輛,管理部門可隨時對車輛進(jìn)行跟蹤和監(jiān)控,并通過語音播報了解車輛的運(yùn)行軌跡,加強(qiáng)對車輛的集中管理和調(diào)度,提高交通運(yùn)輸效率,有效改善城市交通狀況。例如出租車管理部門可以監(jiān)控出租車的行車路線,并以語音播報形式反饋出租車司機(jī)附近位置的搭乘信息,如果遇到陌生路線,司機(jī)可以通過與數(shù)據(jù)庫中心的網(wǎng)絡(luò)連接進(jìn)行語音交互查詢,順利找到目的地的具體位置。
目前,lbs廣泛應(yīng)用于各國的智能交通領(lǐng)域,在日本東京用來緩解市區(qū)交通壓力,在韓國用于檢測實(shí)時交通狀況以減輕高速公路的瓶頸,在歐洲用于道路管理系統(tǒng)等等。憑借智能語音技術(shù),lbs在管理交通事務(wù)、處理緊急事故、提高道路的通行能力和安全系數(shù)等應(yīng)用領(lǐng)域都將起到至關(guān)重要的作用。
智能語音控制技術(shù)發(fā)力智能電網(wǎng)
智能語音控制技術(shù)在電力行業(yè)的廣泛應(yīng)用,是智能電網(wǎng)發(fā)展的必然趨勢。在未來的物聯(lián)網(wǎng)時代,“說出需求得到反饋”的互動模式將進(jìn)一步延伸,所有的電器都將擁有“聽”,甚至是“說”的能力,語音控制將成為構(gòu)建智慧城市的重要手段,人們美好的生活將再次“傳為佳話”。
“出發(fā)!對1號主變進(jìn)行巡檢。”一聲令下,一個身高1米多的巡線機(jī)器人自動啟動,沿著變電站內(nèi)的小路,根據(jù)指令開始工作。未來變電站智能巡檢機(jī)器人工作將出現(xiàn)這樣一個場景。在山東電科院電力機(jī)器人技術(shù)重點(diǎn)實(shí)驗(yàn)室里,機(jī)器人語音交互實(shí)驗(yàn)平臺項(xiàng)目已列入了研究規(guī)劃。
“語音控制功能不但能夠有效利用用戶個性化的語音,提高系統(tǒng)的識別準(zhǔn)確率;而且能夠提高用戶輸入詞表的方便性和靈活性。”山東電科院首席專業(yè)工程師王濱海介紹,“隨著指令發(fā)出者年齡的變化,還可以選擇合適的語音替換用戶原來的語音模型,使得語音智能平臺具備更強(qiáng)的適應(yīng)性,識別效果不會隨著時間變久而變差。”