首頁(yè)>>>技術(shù)>>>voiceXML  語(yǔ)音信箱產(chǎn)品

 

認(rèn)清VoiceXML

黃偉峰 2001/11/22

  隨著CTI(Computer and Telephone Integrated)技術(shù)和語(yǔ)音技術(shù)的發(fā)展,IBM,LUCENT,AT&T和MOTOROLA四大通信公司成立了VoiceXml(Voice Extensible Markup Language)的論壇,通過使用這種新的語(yǔ)言,能使用戶通過電話和語(yǔ)音來(lái)訪問INTERNET。這項(xiàng)技術(shù)能夠幫助企業(yè),電信公司,互連網(wǎng)公司增加網(wǎng)絡(luò)使用率,提高用戶忠誠(chéng)度,開發(fā)新市場(chǎng),增強(qiáng)企業(yè)的競(jìng)爭(zhēng)力。

VoiceXml的起源

  Voice XML 是一個(gè)新的 XML schema 用來(lái)制定通過語(yǔ)音對(duì)話訪問Web 的內(nèi)容和其交互語(yǔ)音應(yīng)答的傳遞標(biāo)準(zhǔn)。在 1999 年初,IBM, 摩托羅拉, 朗訊, 和 AT&T 成立了 Voice XML 論壇, 來(lái)協(xié)調(diào)現(xiàn)有的語(yǔ)音技術(shù)使得可以通過聲音和電話訪問因特網(wǎng)。語(yǔ)音技術(shù)不但讓那些由于環(huán)境或生理限制無(wú)法使用圖形化瀏覽器的人得以訪問 Web,也為所有的用戶提供了更為便捷的 Web 訪問功能。
  新的語(yǔ)音技術(shù)可以創(chuàng)建出對(duì)話驅(qū)動(dòng)的應(yīng)用程序,例如語(yǔ)音識(shí)別技術(shù)(ASR),語(yǔ)音合成技術(shù)(TTS)以及記錄和回放數(shù)字化語(yǔ)音在 PC 和服務(wù)器(分發(fā)到客戶端設(shè)備)上 。Voice XML 提供了一種與技術(shù)語(yǔ)言,可無(wú)關(guān)的以用在語(yǔ)音應(yīng)用程序。這些應(yīng)用程序?qū)⒑蠖颂幚碚Z(yǔ)音的服務(wù)和處理機(jī)制與前端基于 Voice XML 的表示層分離開。例如,一個(gè)精心設(shè)計(jì)的 Web 站點(diǎn)可以輕而易舉地支持語(yǔ)音驅(qū)動(dòng)的瀏覽器(比如您很可能在移動(dòng)電話上會(huì)使用的那種),同時(shí)它有能支持其它的瀏覽器(比如一個(gè) WAP 瀏覽器或 HTML 瀏覽器)。當(dāng)接受到來(lái)自瀏覽器的最初請(qǐng)求時(shí),服務(wù)器將監(jiān)測(cè)出瀏覽器的類型。如果瀏覽器被確認(rèn)為一個(gè)語(yǔ)音瀏覽器,服務(wù)器將返回對(duì)應(yīng)的 Voice XML 頁(yè)面。
  由于VoiveXml技術(shù)和語(yǔ)音技術(shù)的快速發(fā)展,已經(jīng)有超過150個(gè)公司和組織加入和Voice Xml(http://www.voicexml.org)論壇,其中包括一些非常有名的通信公司,如AT&T, LUCENT, MOTOROLA, ALCATEL,CISCO,HITACHI,以及我國(guó)的華為通信公司。

VoiceXml的系統(tǒng)結(jié)構(gòu)及其應(yīng)用舉例

  VoiceXml 1.0規(guī)范基于W3C的工業(yè)標(biāo)準(zhǔn)XML,為語(yǔ)音和電話應(yīng)用的開發(fā)者,服務(wù)提供商和設(shè)備制造商提供了一個(gè)智能化的API。VoiceXml的標(biāo)準(zhǔn)將簡(jiǎn)化WEB上具有語(yǔ)音響音服務(wù)的個(gè)性化界面的創(chuàng)建,使人們能夠通過語(yǔ)音和電話訪問網(wǎng)站上的信息和服務(wù),同時(shí)與CGI(PERL,PHP,C,JAVA SERVLET等)的腳本結(jié)合在一起來(lái)檢索后臺(tái)數(shù)據(jù)庫(kù),訪問企業(yè)內(nèi)部網(wǎng),從而最終將語(yǔ)音瀏覽器與微型瀏覽器融合在一起,實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)與電話技術(shù)的完美結(jié)合。其具體系統(tǒng)結(jié)構(gòu)如下:

  從圖中我們可以看出,同傳統(tǒng)的INTERNET網(wǎng)站相比,在不需要太大的改動(dòng)前提下,只要增加一個(gè)VoiceXml的服務(wù)器處理來(lái)自PSTN的應(yīng)用即可。在VoiceXml的服務(wù)器中,包含了VoiceXml的解釋器(VoiceXml解釋程序語(yǔ)境),VoiceXml自帶的瀏覽器,自動(dòng)語(yǔ)音識(shí)別(ASR)及文本到語(yǔ)音(TTS)的轉(zhuǎn)換設(shè)備。
  VoiceXml解釋程序是一個(gè)計(jì)算機(jī)程序,它解釋一個(gè)VoiceXml文件,引導(dǎo)和控制用戶與執(zhí)行平臺(tái)之間的交互作用。VoiceXml解釋程序語(yǔ)境也是一個(gè)計(jì)算機(jī)程序,用一個(gè)VoiceXml解釋程序解釋一個(gè)VoiceXml文件,并且可以與執(zhí)行平臺(tái)相互作用而與VoiceXml解釋程序無(wú)關(guān)。
其具體流程如下圖所示:

  比如說,用戶想知道INTEL公司的當(dāng)前股價(jià),就打電話到提供該服務(wù)的公司,通過DN—URL的映射,到達(dá)了該網(wǎng)站的VOICEXML的服務(wù)器,VoiceXml的服務(wù)器馬上調(diào)出相應(yīng)的VoiceXml文件,在由VoiceXml解釋程序處理,通過TTS產(chǎn)生語(yǔ)音輸出,來(lái)回復(fù)用戶的請(qǐng)求。當(dāng)然,在處理VoiceXml文件的過程中,有時(shí)還需交給后臺(tái)的CGI程序處理,處理后的結(jié)果再由WEB SERVER交給VoiceXml SERVER處理。處理后用戶可能會(huì)聽到的回答是“Welcome to the stock market,which stock price would you like to know?”,其對(duì)應(yīng)的VoiceXml文件為Welcome.vxml(見資源)。用戶只需回答他(她)所感興趣的股票,如”INTEL“,從而擺脫了傳統(tǒng)IVR令人模糊不清的一大堆選擇。這時(shí)用戶的回答通過VOICEXML SERVER的處理,交給后臺(tái)的CGI程序查詢數(shù)據(jù)庫(kù)中的有關(guān)INTEL股票的價(jià)格,在由VOICEXML SERVER的處理,用戶聽到的可能是”$55“。

VoiceXml的特點(diǎn)和應(yīng)用范圍

VoiceXml作為一種標(biāo)記語(yǔ)言,主要有以下特點(diǎn):
  1、VoiceXml作為一種通過每一文件里指定的多重的交互作用,最小化客戶機(jī)/服務(wù)器之間的交互工作
 。、實(shí)現(xiàn)應(yīng)用開發(fā)者與低層的軟件和系統(tǒng)平臺(tái)上的軟、硬件細(xì)節(jié)無(wú)關(guān)
 。、將用戶交互作用的代碼(在VoiceXML中)從服務(wù)邏輯(CGI 腳本)中分離出來(lái)
 。础⒁固峁┑姆⻊(wù)能隨處可得,要求這些服務(wù)能夠跨越不同的執(zhí)行平臺(tái)。對(duì)于內(nèi)容服務(wù)商、工具提供商和平臺(tái)提供商來(lái)說,VoiceXML是一個(gè)公共語(yǔ)言。
 。怠⑹购(jiǎn)單的交互作用非常易于使用,要求所提供的語(yǔ)音界面能支持復(fù)雜的對(duì)話
  VoiceXML語(yǔ)言描述的通過語(yǔ)音應(yīng)答系統(tǒng)實(shí)現(xiàn)人機(jī)交互通信,其范圍包括:合成語(yǔ)音的輸出(TTS)、音頻文件的輸出、話音輸入的識(shí)別、DTMF輸入的識(shí)別、語(yǔ)音輸入的錄音、電話功能像呼叫轉(zhuǎn)移等。
  VoiceXML提供字符和語(yǔ)音輸入收集,將輸入分配給文件定義的請(qǐng)求變量,并且在用戶回答后做出決定的方法。VoiceXML確定文件可能被連接到其他的文件通過通用資源標(biāo)示符(URI)。
VoiceXml在以下的領(lǐng)域內(nèi)有著廣泛的應(yīng)用。
  1、信息的獲取。如股票信息,天氣情況,體育消息,交通信息等。
  2、電子交易(包括電子商務(wù),電子零售)。如銀行的帳戶查詢,存取,股票交易等。
 。、電信領(lǐng)域的服務(wù)。如UNIFIED MESSAGE,CALL CENTER(呼叫中心)等。

有關(guān)VoiceXml的部分產(chǎn)品介紹

 。薄BM
  IBM主要開發(fā)了VIAVOICE的VOICEXML的服務(wù)器,以及VOICEXML的開發(fā)包,從而能與WEBSPHERE結(jié)合,實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)與電話的完美結(jié)合。但是該服務(wù)器只支持英語(yǔ),法語(yǔ)和德語(yǔ)。
 。、MOTOROLA
  MOTOROLA也有自己的VOICEXML的網(wǎng)關(guān)及開發(fā)VOICEXML的開發(fā)包。但是也不支持 中文。
 。、NUANCE
  NUANCE是一個(gè)專門開發(fā)語(yǔ)音的廠商。他有開發(fā)和構(gòu)架VOICEXML的一整套工具。其中包括VOICE WEB SERVER,V-Builder(開發(fā)VOICEXML的可使化工具),Secure Verifier 。尤其是他對(duì)超過20種語(yǔ)言(包括中文及廣東話)的支持及其優(yōu)良的穩(wěn)定性贏得了很多市場(chǎng)分額,其中包括American Airlines,Bell Atlantic,UPS等大公司都已成為他的客戶。

天極網(wǎng)



相關(guān)鏈接:
基于VoiceXML的可視化IVR系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)(一) 2009-09-22
VoiceXML刷新CTI的開發(fā)模式 2009-02-11
VoiceXML論壇官方認(rèn)證平臺(tái) 2008-12-10
Voxeo Prophecy平臺(tái)開發(fā)VoiceXML應(yīng)用 2008-11-20
基于VoiceXML的語(yǔ)音應(yīng)用系統(tǒng)開發(fā) 2008-10-30
岳阳县| 甘孜县| 潞西市| 黄平县| 甘孜县| 内江市| 鄂伦春自治旗| 大邑县| 河东区| 正蓝旗| 农安县| 嘉祥县| 叶城县| 华池县| 文昌市| 游戏| 海安县| 台中市| 台北市| 新乡县| 涞水县| 临沭县| 垦利县| 丰城市| 大余县| 隆尧县| 扶绥县| 梅州市| 包头市| 江油市| 广州市| 南澳县| 龙南县| 石首市| 潞城市| 古田县| 神池县| 华池县| 班戈县| 喀喇沁旗| 冷水江市|