首頁>>>技術(shù)>>>語音應(yīng)用>>>語音合成(TTS)  語音合成產(chǎn)品

 

語音門戶網(wǎng)革命

Cene Eagle 2000/12/04

  電子商務(wù)是當(dāng)今世界最熱門的商業(yè)趨勢,而語音門戶正在迅速成為電子商務(wù)中的熱點;谡Z音的互聯(lián)網(wǎng)門戶,也就是語音門戶,代表著計算機語音與互聯(lián)網(wǎng)融合的新趨勢。

  語音門戶讓用戶可隨時隨地輕松獲取各種信息。例如,用戶只需用普通電話機或手機撥打語音門戶網(wǎng)的800號碼,就可在語音提示引導(dǎo)之下用自然語言和耳朵便捷地“瀏覽”所需信息。在這個過程中,不必鍵入菜單選擇,僅需簡單的語音應(yīng)答即可完成操作。所以,語音門戶簡單易用—無論是通過PC機、手機或者固定電話,也無論是在辦公室、家中還是在路上、車上,“瀏覽”網(wǎng)絡(luò)的過程變得輕松無比!

  由于語音技術(shù)的發(fā)展,語音門戶將電話交互過程從以廠商為中心轉(zhuǎn)向以用戶為中心。這一轉(zhuǎn)變在為用戶提高效率和降低業(yè)務(wù)成本的同時,還將提高用戶的滿意度。

  未來數(shù)年,語音門戶將大大改變?nèi)藗兪褂秒娫挼姆绞揭约皬S商與主叫用戶溝通的方式。在當(dāng)今以廠商為中心的模式中,主叫用戶只能以掛斷電話的方式來“擺脫”某一企業(yè)的交互式語音應(yīng)答(IVR)系統(tǒng)。而在未來以用戶為中心的模式中,主叫用戶可與語音門戶展開交互式對話,可以象“網(wǎng)上沖浪”般快捷、方便地從一家企業(yè)自由地“跳”到另外一家企業(yè)。


  語音市場火爆


  語音技術(shù)是當(dāng)今迅猛發(fā)展的電子商務(wù)經(jīng)濟最重要的“推進器”之一。語音技術(shù)市場正在迅速成長,且發(fā)展勢頭良好。分析家預(yù)測,從1999年到2004年,語音技術(shù)市場將以每年31%的速度持續(xù)增長。語音技術(shù)市場的迅速擴展意味著我們正面臨著大量部署語音應(yīng)用的轉(zhuǎn)折期。

  語音技術(shù)如此“火爆”有幾方面的原因,這既與語音技術(shù)本身有關(guān),同時也因為語音技術(shù)能夠讓開發(fā)商不斷推出真正滿足現(xiàn)實用戶需求的應(yīng)用。比如,90年代早期,簡單的語音應(yīng)用只支持詞匯較少的(20到30個單詞)命令和控制指令,且只能識別不連續(xù)的數(shù)字,F(xiàn)在,在我們的眼前卻出現(xiàn)了諸如虛擬個人助理、股票交易代理、企業(yè)內(nèi)自動值守、旅游訂票系統(tǒng)和許多其他可實現(xiàn)語音功能的復(fù)雜應(yīng)用。在不久的將來,在互聯(lián)網(wǎng)上更將出現(xiàn)由大型詞匯表(一百萬字條)支持的自動目錄幫助、企業(yè)應(yīng)用托管等象語音門戶這樣的應(yīng)用。


  技術(shù)是發(fā)展動力


  未來語音應(yīng)用的關(guān)鍵在于語音技術(shù)的發(fā)展。在過去幾年里,ASR引擎的精確度和詞匯量已經(jīng)大大提升。精確的算法、顯著增強的處理能力、更低的成本和實現(xiàn)自助溝通、連續(xù)語音技術(shù)的不斷發(fā)展推動了這些進步。Barging技術(shù)也已完善,可使主叫用戶根據(jù)提示進行應(yīng)答,并且可識別用戶的應(yīng)答。自然語言功能的推出也對語音應(yīng)用的用途產(chǎn)生了極大影響。


  倍受服務(wù)商偏愛


  除了新型技術(shù)的出現(xiàn)和原有技術(shù)的發(fā)展外,在當(dāng)今具有強大沖擊力的語音應(yīng)用發(fā)展大潮中,另外一個關(guān)鍵的因素就是技術(shù)供應(yīng)商改變了自己的角色。當(dāng)今的服務(wù)提供商(主要是過去的算法供應(yīng)商)已經(jīng)發(fā)展成為全方位應(yīng)用的提供者,擁有大批人文因素設(shè)計、應(yīng)用分析、系統(tǒng)分析、語言學(xué)和電話應(yīng)用開發(fā)方面的專家,他們推出了廣泛的專業(yè)服務(wù),支持創(chuàng)建、部署和維護高級語音應(yīng)用的功能。


  新工具不斷涌現(xiàn)


  應(yīng)用測試工具已經(jīng)大大改進,使技術(shù)供應(yīng)商能夠開發(fā)快速、持續(xù)部署的應(yīng)用成為可能。

  現(xiàn)在,從一種新型應(yīng)用的基本研究設(shè)計開始,開發(fā)商就可謹慎地、小規(guī)模地進行測試,然后將測試的結(jié)果不斷反饋到開發(fā)過程中,直到可部署實際應(yīng)用為止。一旦一個實際應(yīng)用部署之后,開發(fā)商可將這一技能應(yīng)用到其他類似的應(yīng)用中,這樣,大規(guī)?焖俨渴鹦滦蛻(yīng)用變得相對簡單輕松。

  同時,技術(shù)開發(fā)商也投入了很多精力來開發(fā)可方便快速部署應(yīng)用的強大工具。對話應(yīng)用組件(DAC)便是這樣一種高級程序工具,它融合了大量從應(yīng)用對話設(shè)計和從經(jīng)常性用戶交互中獲得的大量寶貴經(jīng)驗和知識。例如,DAC可包含小程序,這些小程序允許用戶從目錄中選擇項目、讓應(yīng)用程序收集信用卡號碼、接收“是”或“不是”這樣的回答、獲取旅行出發(fā)點和目的地的信息或查看股票價格等。通過提供可再利用的目標(biāo)程序中的專門技術(shù),DAC可大大縮短開發(fā)新型應(yīng)用的時間。過去需30人、數(shù)年才能開發(fā)出的應(yīng)用程序,現(xiàn)在利用更少的人員、在數(shù)月甚或數(shù)周之內(nèi)即可開發(fā)出來。


  轉(zhuǎn)換質(zhì)量提高


  除了語音識別技術(shù)之外,文字轉(zhuǎn)換為語音(TTS)的技術(shù)水平也大大提高,成為促進語音門戶發(fā)展的另一個重要因素。過去由于語音轉(zhuǎn)換質(zhì)量差,阻礙了TTS的廣泛應(yīng)用,而最新一代的TTS技術(shù)顯著地提高了語音轉(zhuǎn)換的質(zhì)量,語言支持也得到很大的提高。此外,TTS現(xiàn)實應(yīng)用中至關(guān)重要的組件—處理“臟”數(shù)據(jù)的預(yù)處理器已經(jīng)開發(fā)出來?尚拚⑻幚碇T如首字母縮寫詞、縮略詞和聲調(diào)的電子郵件預(yù)處理器,也使通過電話閱讀電子郵件信息的應(yīng)用成為可能。


  應(yīng)用前景廣闊


  互聯(lián)網(wǎng)電子交易革命使人們對即時信息接入和強大的交易處理功能提出了更高的要求。為了滿足這種要求,業(yè)界在開發(fā)以HTML等腳本語言為基礎(chǔ)的基礎(chǔ)設(shè)施方面已經(jīng)開展了大量的工作。

  新型的具有語音功能的語言,諸如VoiceXML,正在將互聯(lián)網(wǎng)的功能擴展到電話上,F(xiàn)在,具有語音功能的語言不僅可以利用現(xiàn)有的基礎(chǔ)設(shè)施,并可對支持互聯(lián)網(wǎng)的整個基礎(chǔ)設(shè)施進行補充,將互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施擴展到客戶機/服務(wù)器架構(gòu)中,其結(jié)果是產(chǎn)生了可由基于互聯(lián)網(wǎng)的遠程應(yīng)用來控制的、具有強大功能的語音服務(wù)器平臺。


  語音也要交互


  可實現(xiàn)語音功能的交互式語音應(yīng)答系統(tǒng)(IVR)的發(fā)展速度非常迅猛。比如,可考察一下利用800號碼提供主叫用戶接入服務(wù)的企業(yè),最初的情況是用戶撥打800號碼,然后接到提供服務(wù)的人員處。但企業(yè)很快認識到人員配備成本昂貴,許多工作可采用自動處理方式,從而節(jié)約成本開支。IVR系統(tǒng)即可實現(xiàn)這種自動處理。企業(yè)下一步就是將IVR系統(tǒng)與數(shù)據(jù)庫集成在一起,以便IVR系統(tǒng)可動態(tài)地處理信息。這樣,主叫用戶利用計算機語音集成(CTI)技術(shù)接入企業(yè)的IVR系統(tǒng)。之后,這一呼叫被IVR系統(tǒng)實時轉(zhuǎn)移到相關(guān)人員處,同時,個性化的主叫用戶信息(比如未完成的訂貨情況)可通過彈出的屏幕傳遞給這一處理人員,這為企業(yè)提供最好的服務(wù)建立了堅實的基礎(chǔ)。另外,通過使IVR系統(tǒng)前端具有語音功能,強大的ASR功能可使企業(yè)節(jié)省更多成本。

  對主叫用戶而言,語音意味著更自然和更舒適的界面?蓪崿F(xiàn)語音功能的IVR應(yīng)用也比雙音多頻(DTMF)或按鈕應(yīng)用更方便。這將帶來更好的投資回報。


  第一個語音門戶


  到2001年,全球?qū)⒂?0億多部電話投入使用,任何企業(yè)都不應(yīng)該置身于這些用戶視線之外,否則后果不堪設(shè)想。企業(yè)非常需要借助語音門戶網(wǎng)以向用戶提供接入服務(wù)。在服務(wù)提供商的基礎(chǔ)設(shè)施中添加的語音門戶網(wǎng),將從根本上改變企業(yè)與用戶“溝通”的方式,以及用戶與企業(yè)互動的方式。

  11月24日,TOM.COM在國內(nèi)第一個開通了語音門戶“TOM及時語”,用戶通過撥打熱線電話(010-85180012)即可通過與系統(tǒng)的語音交互獲得個人理財、語音郵件、航班查詢、北京地區(qū)酒店預(yù)定、定餐及叫車、全球新聞、天氣預(yù)報等內(nèi)容廣泛的服務(wù)。

  TOM及時語由于采用了計算機電話集成技術(shù)的開創(chuàng)者和領(lǐng)導(dǎo)者Intel子公司Dialogic的語音門戶開發(fā)平臺和全球語音技術(shù)領(lǐng)導(dǎo)者IBM公司的語音識別技術(shù)和語音合成技術(shù),因此在短短3個月時間內(nèi)就完成了系統(tǒng)的開發(fā)和測試,真正體現(xiàn)了互聯(lián)網(wǎng)時代的效率和速度。這再次證明,快速、大規(guī)模部署語音門戶的技術(shù)條件已經(jīng)成熟,語音門戶的時代已經(jīng)到來!

《賽迪市場專家》2000/12/04

 


分類信息:  語音合成TTS_與_語音識別ASR     技術(shù)_語音合成_文摘   技術(shù)_語音識別_文摘
涡阳县| 娄烦县| 彝良县| 沅陵县| 岑巩县| 哈尔滨市| 沙河市| 旺苍县| 翁牛特旗| 景洪市| 报价| 广宗县| 邯郸市| 山东省| 綦江县| 巍山| 哈密市| 五常市| 莆田市| 靖边县| 饶阳县| 勐海县| 张家口市| 望谟县| 迁西县| 龙海市| 东港市| 应用必备| 集安市| 天镇县| 周口市| 西吉县| 新密市| 资中县| 镇远县| 汕尾市| 温宿县| 昭平县| 固安县| 海淀区| 喀喇|