語音門戶網(wǎng)革命
Cene Eagle 2000/12/04
電子商務(wù)是當(dāng)今世界最熱門的商業(yè)趨勢(shì),而語音門戶正在迅速成為電子商務(wù)中的熱點(diǎn);谡Z音的互聯(lián)網(wǎng)門戶,也就是語音門戶,代表著計(jì)算機(jī)語音與互聯(lián)網(wǎng)融合的新趨勢(shì)。
語音門戶讓用戶可隨時(shí)隨地輕松獲取各種信息。例如,用戶只需用普通電話機(jī)或手機(jī)撥打語音門戶網(wǎng)的800號(hào)碼,就可在語音提示引導(dǎo)之下用自然語言和耳朵便捷地“瀏覽”所需信息。在這個(gè)過程中,不必鍵入菜單選擇,僅需簡(jiǎn)單的語音應(yīng)答即可完成操作。所以,語音門戶簡(jiǎn)單易用—無論是通過PC機(jī)、手機(jī)或者固定電話,也無論是在辦公室、家中還是在路上、車上,“瀏覽”網(wǎng)絡(luò)的過程變得輕松無比!
由于語音技術(shù)的發(fā)展,語音門戶將電話交互過程從以廠商為中心轉(zhuǎn)向以用戶為中心。這一轉(zhuǎn)變?cè)跒橛脩籼岣咝屎徒档蜆I(yè)務(wù)成本的同時(shí),還將提高用戶的滿意度。
未來數(shù)年,語音門戶將大大改變?nèi)藗兪褂秒娫挼姆绞揭约皬S商與主叫用戶溝通的方式。在當(dāng)今以廠商為中心的模式中,主叫用戶只能以掛斷電話的方式來“擺脫”某一企業(yè)的交互式語音應(yīng)答(IVR)系統(tǒng)。而在未來以用戶為中心的模式中,主叫用戶可與語音門戶展開交互式對(duì)話,可以象“網(wǎng)上沖浪”般快捷、方便地從一家企業(yè)自由地“跳”到另外一家企業(yè)。
語音市場(chǎng)火爆
語音技術(shù)是當(dāng)今迅猛發(fā)展的電子商務(wù)經(jīng)濟(jì)最重要的“推進(jìn)器”之一。語音技術(shù)市場(chǎng)正在迅速成長(zhǎng),且發(fā)展勢(shì)頭良好。分析家預(yù)測(cè),從1999年到2004年,語音技術(shù)市場(chǎng)將以每年31%的速度持續(xù)增長(zhǎng)。語音技術(shù)市場(chǎng)的迅速擴(kuò)展意味著我們正面臨著大量部署語音應(yīng)用的轉(zhuǎn)折期。
語音技術(shù)如此“火爆”有幾方面的原因,這既與語音技術(shù)本身有關(guān),同時(shí)也因?yàn)檎Z音技術(shù)能夠讓開發(fā)商不斷推出真正滿足現(xiàn)實(shí)用戶需求的應(yīng)用。比如,90年代早期,簡(jiǎn)單的語音應(yīng)用只支持詞匯較少的(20到30個(gè)單詞)命令和控制指令,且只能識(shí)別不連續(xù)的數(shù)字,F(xiàn)在,在我們的眼前卻出現(xiàn)了諸如虛擬個(gè)人助理、股票交易代理、企業(yè)內(nèi)自動(dòng)值守、旅游訂票系統(tǒng)和許多其他可實(shí)現(xiàn)語音功能的復(fù)雜應(yīng)用。在不久的將來,在互聯(lián)網(wǎng)上更將出現(xiàn)由大型詞匯表(一百萬字條)支持的自動(dòng)目錄幫助、企業(yè)應(yīng)用托管等象語音門戶這樣的應(yīng)用。
技術(shù)是發(fā)展動(dòng)力
未來語音應(yīng)用的關(guān)鍵在于語音技術(shù)的發(fā)展。在過去幾年里,ASR引擎的精確度和詞匯量已經(jīng)大大提升。精確的算法、顯著增強(qiáng)的處理能力、更低的成本和實(shí)現(xiàn)自助溝通、連續(xù)語音技術(shù)的不斷發(fā)展推動(dòng)了這些進(jìn)步。Barging技術(shù)也已完善,可使主叫用戶根據(jù)提示進(jìn)行應(yīng)答,并且可識(shí)別用戶的應(yīng)答。自然語言功能的推出也對(duì)語音應(yīng)用的用途產(chǎn)生了極大影響。
倍受服務(wù)商偏愛
除了新型技術(shù)的出現(xiàn)和原有技術(shù)的發(fā)展外,在當(dāng)今具有強(qiáng)大沖擊力的語音應(yīng)用發(fā)展大潮中,另外一個(gè)關(guān)鍵的因素就是技術(shù)供應(yīng)商改變了自己的角色。當(dāng)今的服務(wù)提供商(主要是過去的算法供應(yīng)商)已經(jīng)發(fā)展成為全方位應(yīng)用的提供者,擁有大批人文因素設(shè)計(jì)、應(yīng)用分析、系統(tǒng)分析、語言學(xué)和電話應(yīng)用開發(fā)方面的專家,他們推出了廣泛的專業(yè)服務(wù),支持創(chuàng)建、部署和維護(hù)高級(jí)語音應(yīng)用的功能。
新工具不斷涌現(xiàn)
應(yīng)用測(cè)試工具已經(jīng)大大改進(jìn),使技術(shù)供應(yīng)商能夠開發(fā)快速、持續(xù)部署的應(yīng)用成為可能。
現(xiàn)在,從一種新型應(yīng)用的基本研究設(shè)計(jì)開始,開發(fā)商就可謹(jǐn)慎地、小規(guī)模地進(jìn)行測(cè)試,然后將測(cè)試的結(jié)果不斷反饋到開發(fā)過程中,直到可部署實(shí)際應(yīng)用為止。一旦一個(gè)實(shí)際應(yīng)用部署之后,開發(fā)商可將這一技能應(yīng)用到其他類似的應(yīng)用中,這樣,大規(guī)?焖俨渴鹦滦蛻(yīng)用變得相對(duì)簡(jiǎn)單輕松。
同時(shí),技術(shù)開發(fā)商也投入了很多精力來開發(fā)可方便快速部署應(yīng)用的強(qiáng)大工具。對(duì)話應(yīng)用組件(DAC)便是這樣一種高級(jí)程序工具,它融合了大量從應(yīng)用對(duì)話設(shè)計(jì)和從經(jīng)常性用戶交互中獲得的大量寶貴經(jīng)驗(yàn)和知識(shí)。例如,DAC可包含小程序,這些小程序允許用戶從目錄中選擇項(xiàng)目、讓應(yīng)用程序收集信用卡號(hào)碼、接收“是”或“不是”這樣的回答、獲取旅行出發(fā)點(diǎn)和目的地的信息或查看股票價(jià)格等。通過提供可再利用的目標(biāo)程序中的專門技術(shù),DAC可大大縮短開發(fā)新型應(yīng)用的時(shí)間。過去需30人、數(shù)年才能開發(fā)出的應(yīng)用程序,現(xiàn)在利用更少的人員、在數(shù)月甚或數(shù)周之內(nèi)即可開發(fā)出來。
轉(zhuǎn)換質(zhì)量提高
除了語音識(shí)別技術(shù)之外,文字轉(zhuǎn)換為語音(TTS)的技術(shù)水平也大大提高,成為促進(jìn)語音門戶發(fā)展的另一個(gè)重要因素。過去由于語音轉(zhuǎn)換質(zhì)量差,阻礙了TTS的廣泛應(yīng)用,而最新一代的TTS技術(shù)顯著地提高了語音轉(zhuǎn)換的質(zhì)量,語言支持也得到很大的提高。此外,TTS現(xiàn)實(shí)應(yīng)用中至關(guān)重要的組件—處理“臟”數(shù)據(jù)的預(yù)處理器已經(jīng)開發(fā)出來?尚拚、處理諸如首字母縮寫詞、縮略詞和聲調(diào)的電子郵件預(yù)處理器,也使通過電話閱讀電子郵件信息的應(yīng)用成為可能。
應(yīng)用前景廣闊
互聯(lián)網(wǎng)電子交易革命使人們對(duì)即時(shí)信息接入和強(qiáng)大的交易處理功能提出了更高的要求。為了滿足這種要求,業(yè)界在開發(fā)以HTML等腳本語言為基礎(chǔ)的基礎(chǔ)設(shè)施方面已經(jīng)開展了大量的工作。
新型的具有語音功能的語言,諸如VoiceXML,正在將互聯(lián)網(wǎng)的功能擴(kuò)展到電話上,F(xiàn)在,具有語音功能的語言不僅可以利用現(xiàn)有的基礎(chǔ)設(shè)施,并可對(duì)支持互聯(lián)網(wǎng)的整個(gè)基礎(chǔ)設(shè)施進(jìn)行補(bǔ)充,將互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施擴(kuò)展到客戶機(jī)/服務(wù)器架構(gòu)中,其結(jié)果是產(chǎn)生了可由基于互聯(lián)網(wǎng)的遠(yuǎn)程應(yīng)用來控制的、具有強(qiáng)大功能的語音服務(wù)器平臺(tái)。
語音也要交互
可實(shí)現(xiàn)語音功能的交互式語音應(yīng)答系統(tǒng)(IVR)的發(fā)展速度非常迅猛。比如,可考察一下利用800號(hào)碼提供主叫用戶接入服務(wù)的企業(yè),最初的情況是用戶撥打800號(hào)碼,然后接到提供服務(wù)的人員處。但企業(yè)很快認(rèn)識(shí)到人員配備成本昂貴,許多工作可采用自動(dòng)處理方式,從而節(jié)約成本開支。IVR系統(tǒng)即可實(shí)現(xiàn)這種自動(dòng)處理。企業(yè)下一步就是將IVR系統(tǒng)與數(shù)據(jù)庫集成在一起,以便IVR系統(tǒng)可動(dòng)態(tài)地處理信息。這樣,主叫用戶利用計(jì)算機(jī)語音集成(CTI)技術(shù)接入企業(yè)的IVR系統(tǒng)。之后,這一呼叫被IVR系統(tǒng)實(shí)時(shí)轉(zhuǎn)移到相關(guān)人員處,同時(shí),個(gè)性化的主叫用戶信息(比如未完成的訂貨情況)可通過彈出的屏幕傳遞給這一處理人員,這為企業(yè)提供最好的服務(wù)建立了堅(jiān)實(shí)的基礎(chǔ)。另外,通過使IVR系統(tǒng)前端具有語音功能,強(qiáng)大的ASR功能可使企業(yè)節(jié)省更多成本。
對(duì)主叫用戶而言,語音意味著更自然和更舒適的界面?蓪(shí)現(xiàn)語音功能的IVR應(yīng)用也比雙音多頻(DTMF)或按鈕應(yīng)用更方便。這將帶來更好的投資回報(bào)。
第一個(gè)語音門戶
到2001年,全球?qū)⒂?0億多部電話投入使用,任何企業(yè)都不應(yīng)該置身于這些用戶視線之外,否則后果不堪設(shè)想。企業(yè)非常需要借助語音門戶網(wǎng)以向用戶提供接入服務(wù)。在服務(wù)提供商的基礎(chǔ)設(shè)施中添加的語音門戶網(wǎng),將從根本上改變企業(yè)與用戶“溝通”的方式,以及用戶與企業(yè)互動(dòng)的方式。
11月24日,TOM.COM在國內(nèi)第一個(gè)開通了語音門戶“TOM及時(shí)語”,用戶通過撥打熱線電話(010-85180012)即可通過與系統(tǒng)的語音交互獲得個(gè)人理財(cái)、語音郵件、航班查詢、北京地區(qū)酒店預(yù)定、定餐及叫車、全球新聞、天氣預(yù)報(bào)等內(nèi)容廣泛的服務(wù)。
TOM及時(shí)語由于采用了計(jì)算機(jī)電話集成技術(shù)的開創(chuàng)者和領(lǐng)導(dǎo)者Intel子公司Dialogic的語音門戶開發(fā)平臺(tái)和全球語音技術(shù)領(lǐng)導(dǎo)者IBM公司的語音識(shí)別技術(shù)和語音合成技術(shù),因此在短短3個(gè)月時(shí)間內(nèi)就完成了系統(tǒng)的開發(fā)和測(cè)試,真正體現(xiàn)了互聯(lián)網(wǎng)時(shí)代的效率和速度。這再次證明,快速、大規(guī)模部署語音門戶的技術(shù)條件已經(jīng)成熟,語音門戶的時(shí)代已經(jīng)到來!
《賽迪市場(chǎng)專家》2000/12/04