關(guān)于制定中國(guó)移動(dòng)互聯(lián)網(wǎng)語(yǔ)音應(yīng)用協(xié)議標(biāo)準(zhǔn)的建議
2001/03/11
一 引言
以互聯(lián)網(wǎng)為代表的信息產(chǎn)業(yè)為中國(guó)帶來(lái)了巨大的機(jī)會(huì)和挑戰(zhàn),中國(guó)社會(huì)開始進(jìn)入一個(gè)以信息為核心的時(shí)代。如何快速準(zhǔn)確地獲取所關(guān)心的信息,對(duì)人們的日常工作和生活已經(jīng)具有越來(lái)越重要的影響。
計(jì)算機(jī)作為互聯(lián)網(wǎng)絡(luò)的一種重要信息終端,是目前人們從互聯(lián)網(wǎng)上獲取信息的主要工具。然而,在計(jì)算機(jī)普及率、互聯(lián)網(wǎng)普及率以及教育程度相對(duì)較低的中國(guó),使用計(jì)算機(jī)上網(wǎng),獲取信息和進(jìn)行通訊對(duì)于廣大百姓來(lái)說(shuō),還是一個(gè)神秘的期望。
至今為止,Internet 的訪問(wèn)模式逐漸從單一的PC訪問(wèn)方式向多種用戶終端發(fā)展 ,出現(xiàn)了移動(dòng)電話、PDA、機(jī)頂盒等。
如何解決信息產(chǎn)業(yè)化和社會(huì)發(fā)展水平之間的矛盾,依據(jù)中國(guó)具體國(guó)情,盡可能的實(shí)現(xiàn)信息技術(shù)的普及,促進(jìn)中國(guó)信息社會(huì)進(jìn)步的發(fā)展,使信息技術(shù)這樣的高科技輕松的進(jìn)入中國(guó)大多數(shù)百姓家,在中國(guó)具有巨大的市場(chǎng)前景和社會(huì)效益。
而近年來(lái)語(yǔ)音技術(shù)的飛速發(fā)展和不斷成熟,以及中文語(yǔ)音應(yīng)用技術(shù)的突破,為信息網(wǎng)絡(luò)帶來(lái)了一種極具誘惑的信息終端-----電話。
電話是中國(guó)百姓最為熟悉的通信工具,中國(guó)電話的普及率為全球第二,相對(duì)現(xiàn)今不到1000萬(wàn)的互聯(lián)網(wǎng)電腦終端用戶來(lái)說(shuō),高達(dá)2億的電話用戶具有更為重要的意義。而語(yǔ)音應(yīng)用技術(shù),為中國(guó)百姓建立了一條輕松通達(dá)信息時(shí)代的高速公路,將信息科技以最為親切的方式帶到了人們身邊。
二 為何選擇語(yǔ)音應(yīng)用技術(shù)
語(yǔ)音應(yīng)用技術(shù),是連接互聯(lián)網(wǎng)的與電話用戶的紐帶,其使普通電話、手機(jī)等成為五花八門的網(wǎng)絡(luò)終端之一,并最大的擴(kuò)展了互聯(lián)網(wǎng)用戶。
2.1.語(yǔ)音與計(jì)算機(jī)
語(yǔ)音,是人類最為熟悉的交流方式。人有70%的信息獲取是通過(guò)聽,而90%的信息表達(dá)是通過(guò)說(shuō)。語(yǔ)音是人們?cè)儐?wèn)問(wèn)題,交換觀念、分享經(jīng)驗(yàn)和建立關(guān)系的最主要方式,人類通過(guò)語(yǔ)音傳達(dá)著大量的信息。
長(zhǎng)期以來(lái),人與計(jì)算機(jī)的交互主要是通過(guò)鍵盤、鼠標(biāo)和屏幕。雖然隨著圖形用戶界面(GUI)的日臻完善、各種輸入法的不斷出現(xiàn)和成熟,以及手寫輸入的應(yīng)用使人與計(jì)算機(jī)的交換越來(lái)越簡(jiǎn)單方便,但追求完美和卓越的網(wǎng)絡(luò)時(shí)代,人們也愈加強(qiáng)烈地渴求一種更方便更自然的人機(jī)界面。而語(yǔ)音必然成為人們最為熟悉和輕松的人機(jī)交互方式。
2.2.語(yǔ)音技術(shù)
作為智能計(jì)算機(jī)研究的主導(dǎo)方向和人機(jī)通信的關(guān)鍵技術(shù),語(yǔ)音技術(shù)對(duì)計(jì)算機(jī)發(fā)展和社會(huì)生活的重要性日益凸現(xiàn)出來(lái)。作為語(yǔ)音技術(shù)中最主要的兩大技術(shù):語(yǔ)音識(shí)別技術(shù)(ASR)和語(yǔ)音合成技術(shù)(TTS),隨著近年來(lái)人們?cè)跀?shù)學(xué)算法和聲學(xué)模型取得的突破和飛速提高,語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)以及自然語(yǔ)言處理技術(shù)的成熟,使電腦能“說(shuō)”,能“聽”,使人與機(jī)器的交流能象人與人之間對(duì)話一樣輕松和自然。
正如當(dāng)初圖形用戶界面(GUI)改變了個(gè)人電腦一樣,以語(yǔ)音技術(shù)為核心的語(yǔ)音用戶界面(VUI)正在改變著電腦和電話系統(tǒng),以及各種智能設(shè)備。
2.3.語(yǔ)音應(yīng)用技術(shù)
語(yǔ)音應(yīng)用技術(shù)(Voice Application Technology ),是指人們可以使用有線電話或移動(dòng)電話,以及PC、PDA和其它智能設(shè)備通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成的交互技術(shù),以及語(yǔ)音瀏覽、智能信息處理技術(shù)等實(shí)現(xiàn)人們?cè)L問(wèn)互聯(lián)網(wǎng)絡(luò),以及實(shí)現(xiàn)個(gè)人服務(wù)和商業(yè)服務(wù)的應(yīng)用技術(shù)。
語(yǔ)音應(yīng)用技術(shù),是語(yǔ)音技術(shù)(ASR和TTS TT)、語(yǔ)音瀏覽技術(shù)、智能文字信息處理技術(shù)等技術(shù)的集合,其形成一個(gè)完整的技術(shù)應(yīng)用規(guī)范體系,建立于已有相關(guān)技術(shù)協(xié)議標(biāo)準(zhǔn)上,著重于應(yīng)用開發(fā)。
語(yǔ)音應(yīng)用技術(shù)是跨接以語(yǔ)音為核心的電話網(wǎng)絡(luò)和以數(shù)據(jù)為核心的互聯(lián)網(wǎng)絡(luò)的一座橋梁,使有線電話和移動(dòng)電話成為互聯(lián)網(wǎng)絡(luò)信息終端,為人們以自然語(yǔ)言交互的方式來(lái)遨游信息信息打開了一扇自由的大門。語(yǔ)音應(yīng)用技術(shù)覆蓋語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音瀏覽、語(yǔ)音集成、語(yǔ)音交互、Web服務(wù)等技術(shù)領(lǐng)域,可以輕松介入現(xiàn)有的網(wǎng)絡(luò)信息系統(tǒng),集成現(xiàn)有的各類信息處理技術(shù),如Web 、WAP、GPRS等等。
2.4.語(yǔ)音應(yīng)用技術(shù)的優(yōu)勢(shì)
為何語(yǔ)音應(yīng)用技術(shù)對(duì)于互聯(lián)網(wǎng)絡(luò),對(duì)于信息技術(shù)如此重要?首先,是因?yàn)殡娫挼闹匾。電話在的全球發(fā)達(dá)地區(qū)幾乎無(wú)所不在,時(shí)刻出現(xiàn)在人們身邊。電話的數(shù)量遠(yuǎn)遠(yuǎn)大于電腦的數(shù)量,更遠(yuǎn)大于連接了互聯(lián)網(wǎng)的電腦數(shù)量。尤其是在中國(guó),電話相對(duì)電腦在更大程度上更是人們生活中最平常的設(shè)備。
隨著移動(dòng)電話越來(lái)越小,越來(lái)越輕,越來(lái)越便宜,以及移動(dòng)電話電池使用時(shí)間越來(lái)越長(zhǎng),其所具備的便攜性遠(yuǎn)勝于電腦。而伴隨移動(dòng)通信技術(shù)的飛速發(fā)展,他們更具備了電腦不具備的優(yōu)勢(shì),比如全球定位。你甚至可以在開車時(shí)方便的使用移動(dòng)電話。
語(yǔ)音對(duì)于電話具有同樣的重要性,語(yǔ)音是電話的生命,是電信網(wǎng)絡(luò)的數(shù)據(jù)血液。雖然在移動(dòng)電話中出現(xiàn)了WAP這樣很有用的技術(shù),使移動(dòng)電話可以作為網(wǎng)絡(luò)終端,但WAP手機(jī)的屏幕太小而具有很大的局限性,在手機(jī)鍵盤上進(jìn)行輸入也相當(dāng)麻煩。雖然I-Mode系統(tǒng)正引人關(guān)注,但它同樣具有類似問(wèn)題。
語(yǔ)音具有其獨(dú)特的優(yōu)勢(shì),而且語(yǔ)音比鍵盤和閱讀更具親切感。當(dāng)然,圖象和文字依然很重要,我們相信,我們不久就可以見到“多模式”的設(shè)備,可以圖象和文字的方式進(jìn)行,或以語(yǔ)音的方式進(jìn)行,甚至可以混合語(yǔ)音和圖象。而這正是語(yǔ)音應(yīng)用技術(shù)帶來(lái)的美好情景。
同樣,語(yǔ)音對(duì)于Internet也一樣重要。首先,基于語(yǔ)音瀏覽技術(shù)的語(yǔ)音應(yīng)用系統(tǒng)的開發(fā)很容易,應(yīng)用應(yīng)用技術(shù)可以輕松建立豐富的、廉價(jià)的和高效的Web應(yīng)用,以及開發(fā)工具。其次,語(yǔ)音應(yīng)用系統(tǒng)很容易發(fā)布,不再需要建立一個(gè)指定的專用的語(yǔ)音服務(wù)器,基于語(yǔ)音瀏覽機(jī)制的語(yǔ)音應(yīng)用可以放在Internet 上的任意一個(gè)地方,而用戶通過(guò)電話,可以象使用IE這樣的瀏覽器一樣進(jìn)行查詢、書簽以及鏈接等其他Web的瀏覽方式。
而基于現(xiàn)有Web技術(shù)的語(yǔ)音Web服務(wù)技術(shù),具有現(xiàn)有Web技術(shù)的同樣優(yōu)勢(shì),可以進(jìn)行安全交易、下載信息、收聽mp3等服務(wù)。且更為快捷和自然。
語(yǔ)音自然交互更具有其它信息終端不具備的優(yōu)勢(shì),利用自然語(yǔ)音交互技術(shù),用戶不再需要一項(xiàng)一項(xiàng)的填寫Web的Form表單,不再需要痛苦的在小小的手機(jī)鍵盤上換著數(shù)字輸入名字和E-mail地址;陉P(guān)鍵字捕捉和自然語(yǔ)言處理技術(shù),用戶可以輕松的說(shuō)一句:“我是注冊(cè)用戶 張三,請(qǐng)幫我查 深發(fā)展A 現(xiàn)在的股價(jià),發(fā)個(gè)短消息給我!币磺休p松自然。
2.5.語(yǔ)音應(yīng)用技術(shù)和移動(dòng)互聯(lián)網(wǎng)絡(luò)
Internet和移動(dòng)通信,作為邁向信息社會(huì)的兩個(gè)重要標(biāo)志分別對(duì)應(yīng)著對(duì)大量信息資源的有效訪問(wèn)和隨處漫游的個(gè)人通信。如何結(jié)合它們的技術(shù)優(yōu)勢(shì),在不受信息源的限制和用戶訪問(wèn)時(shí)位置限制的同時(shí),以統(tǒng)一的標(biāo)準(zhǔn)向用戶提供無(wú)處不在的信息網(wǎng)絡(luò)服務(wù),已成為網(wǎng)絡(luò)界和電信界共同關(guān)注的一個(gè)焦點(diǎn)問(wèn)題。
現(xiàn)在出現(xiàn)的WAP、GPRS、Mobile IP、Mobile IP Phone等等技術(shù),使移動(dòng)互聯(lián)網(wǎng)帶來(lái)了全新的概念。而應(yīng)用正是啟動(dòng)移動(dòng)互聯(lián)產(chǎn)業(yè)鏈的引擎,是連接移動(dòng)互聯(lián)與最終用戶的紐帶。而多種信息終端設(shè)備的出現(xiàn)和應(yīng)用以及多種數(shù)據(jù)通信技術(shù)的發(fā)展和應(yīng)用促進(jìn)了移動(dòng)互聯(lián)業(yè)務(wù)的普及與推廣,縮短了移動(dòng)互聯(lián)與最終用戶之間的距離,在個(gè)人定位、個(gè)人信用、人性化服務(wù)等方面開辟了新的發(fā)展空間。
語(yǔ)音應(yīng)用技術(shù)相比較WAP、GPRS等其它技術(shù),則更有利于移動(dòng)互聯(lián)網(wǎng)的普及和發(fā)展,體現(xiàn)了移動(dòng)互聯(lián)網(wǎng)絡(luò)的特性。語(yǔ)音應(yīng)用技術(shù)可以介入移動(dòng)互聯(lián)網(wǎng)絡(luò)幾乎所有的信息終端,其基于語(yǔ)音服務(wù)器和語(yǔ)音網(wǎng)關(guān)的體系結(jié)構(gòu)模型使得移動(dòng)新業(yè)務(wù)服務(wù)的開發(fā)和發(fā)布輕松而簡(jiǎn)單,將原來(lái)基于Web的服務(wù)帶到了電話用戶和移動(dòng)用戶面前。
三 制定中國(guó)語(yǔ)音應(yīng)用協(xié)議標(biāo)準(zhǔn)的建議
語(yǔ)音應(yīng)用技術(shù)在中國(guó),有著廣闊的前景和市場(chǎng),對(duì)中國(guó)移動(dòng)互聯(lián)產(chǎn)業(yè)的建設(shè)和發(fā)展,促進(jìn)中國(guó)社會(huì)信息化,普及信息技術(shù)應(yīng)用有著重要的意義。
我們建議,制定我國(guó)有關(guān)于語(yǔ)音應(yīng)用技術(shù)的標(biāo)準(zhǔn)協(xié)議,以促進(jìn)中國(guó)語(yǔ)音應(yīng)用技術(shù)的發(fā)展,普及中國(guó)信息技術(shù)應(yīng)用,加速移動(dòng)互聯(lián)和網(wǎng)絡(luò)信息服務(wù)的產(chǎn)業(yè)化。做為中國(guó)漢語(yǔ)語(yǔ)音應(yīng)用技術(shù)的先行者和探索者,我們根據(jù)中國(guó)國(guó)情和漢語(yǔ)語(yǔ)音應(yīng)用的特點(diǎn),參考國(guó)際行業(yè)技術(shù)規(guī)范和標(biāo)準(zhǔn),綜合我們?cè)陂L(zhǎng)期的探索中的經(jīng)驗(yàn),提出語(yǔ)音應(yīng)用協(xié)議的規(guī)范建議。
3.1.定義
語(yǔ)音應(yīng)用協(xié)議(Voice Application Protocol ),是在互聯(lián)網(wǎng)絡(luò)和通信網(wǎng)絡(luò)(有線電話網(wǎng)絡(luò)和無(wú)線通信網(wǎng)絡(luò))基于語(yǔ)音技術(shù)開發(fā)應(yīng)用和服務(wù),以及相關(guān)設(shè)備的工業(yè)技術(shù)規(guī)范。語(yǔ)音應(yīng)用協(xié)議(VAP VA)制定了語(yǔ)音應(yīng)用的架構(gòu)和網(wǎng)絡(luò)協(xié)議,詳細(xì)說(shuō)明語(yǔ)音終端設(shè)備(如電話、手機(jī)、內(nèi)嵌語(yǔ)音瀏覽器的智能設(shè)備、PC等)與網(wǎng)絡(luò)的通信協(xié)議和技術(shù)規(guī)范。該協(xié)議擴(kuò)展和協(xié)調(diào)了通信網(wǎng)絡(luò)技術(shù)(如移動(dòng)網(wǎng)絡(luò)數(shù)字通信標(biāo)準(zhǔn)和Internet技術(shù)(如XML、Web以及多種的信息內(nèi)容格式等)。該協(xié)議可以幫助移動(dòng)互聯(lián)網(wǎng)絡(luò)的運(yùn)營(yíng)商、設(shè)備廠商、應(yīng)用開發(fā)商等建立基于語(yǔ)音方式的靈活、快捷、高效的服務(wù)。
3.2.動(dòng)機(jī)
語(yǔ)音應(yīng)用協(xié)議(VAP VA)定位于通信網(wǎng)絡(luò)和Internet的聚覺(jué)點(diǎn),制定以語(yǔ)音的方式提供兩者通訊和為龐大的電話用戶和飛速發(fā)展的互聯(lián)網(wǎng)絡(luò)用戶提供快捷、方便、自然的語(yǔ)音應(yīng)用服務(wù)。
語(yǔ)音應(yīng)用的特征是以非形象的信息方式-----聲音為信息表征,其終端設(shè)備局限于電話和手機(jī)等簡(jiǎn)單輸入設(shè)備?梢岳玫娜藱C(jī)對(duì)話工具只有話筒、聽筒、數(shù)字鍵盤,以及手機(jī)屏幕。由于人對(duì)語(yǔ)音信息較快的反應(yīng)能力和弱的記憶力,決定了語(yǔ)音應(yīng)用的信息呈現(xiàn)方式必須簡(jiǎn)短和簡(jiǎn)單。
利用語(yǔ)音應(yīng)用協(xié)議的相關(guān)技術(shù),可以提供給客戶方便、輕松、自然的對(duì)話式的用戶界面,為簡(jiǎn)易終端(電話、手機(jī))的用戶提供Internet上的信息和服務(wù),以及語(yǔ)音電子商務(wù)和個(gè)性化電信服務(wù)等等。
使用簡(jiǎn)易的語(yǔ)音終端設(shè)備,可以實(shí)現(xiàn)例如以下的語(yǔ)音應(yīng)用:
3.3.需求
根據(jù)語(yǔ)音應(yīng)用技術(shù)的特性和應(yīng)用,語(yǔ)音應(yīng)用協(xié)議(VAP)的需求如下:
為信息服務(wù)和集成提供可編程模型
3.4.體系結(jié)構(gòu)
語(yǔ)音應(yīng)用協(xié)議的體系結(jié)構(gòu)類似于WWW的體系結(jié)構(gòu)和WAP的體系結(jié)構(gòu),圖一是WWW的體系結(jié)構(gòu):
而下圖(圖二)是WAP的體系結(jié)構(gòu)模型:
類似的,我們可以看到語(yǔ)音應(yīng)用協(xié)議(VAP)的體系機(jī)構(gòu)模型如下:
語(yǔ)音應(yīng)用協(xié)議(VAP VA)定義了終端--?網(wǎng)關(guān)--?服務(wù)器的體系結(jié)構(gòu)。語(yǔ)音服務(wù)器(Voice Server )是語(yǔ)音應(yīng)用的服務(wù)器,其包含語(yǔ)音應(yīng)用和數(shù)據(jù)、內(nèi)容;與WAP體系結(jié)構(gòu)不同的是,語(yǔ)音網(wǎng)關(guān)(Voice Gateway) 做為終端和語(yǔ)音應(yīng)用服務(wù)器的橋梁,作為語(yǔ)音應(yīng)用協(xié)議中的重要部分:語(yǔ)音瀏覽器(Voice Browser)建于語(yǔ)音網(wǎng)關(guān)(Voice Gateway)內(nèi),而不象WAP協(xié)議中,micro browser 建于終端中。這是因?yàn)檎Z(yǔ)音終端過(guò)于簡(jiǎn)單以及語(yǔ)音數(shù)據(jù)可以通過(guò)電信網(wǎng)絡(luò)輕松與語(yǔ)音網(wǎng)關(guān)(Voice Gateway)交互。
語(yǔ)音應(yīng)用協(xié)議(VAP)定義了:
3.5.組成部分
語(yǔ)音應(yīng)用協(xié)議(VAP VA)也有一個(gè)類似于TCP/IP和WAP的層次結(jié)構(gòu),如下圖(圖四)所示:
事務(wù)層,其中包括
語(yǔ)音應(yīng)用協(xié)議不僅僅為實(shí)現(xiàn)語(yǔ)音應(yīng)用技術(shù)而設(shè)計(jì),它的設(shè)計(jì)中使語(yǔ)音應(yīng)用可以操作多種不同的應(yīng)用,如短消息、WAP等。其在每個(gè)層次上都提供擴(kuò)展性的已定義好的接口,使其不僅僅限制于語(yǔ)音應(yīng)用協(xié)議(VAP)所描述和定義的范圍內(nèi)。
四 語(yǔ)音應(yīng)用協(xié)議方案的好處
語(yǔ)音應(yīng)用協(xié)議(VAP)用以實(shí)現(xiàn)互聯(lián)網(wǎng)絡(luò)與有線電話、移動(dòng)電話等簡(jiǎn)單終端進(jìn)行交互,將信息應(yīng)用技術(shù)和服務(wù),以及移動(dòng)互聯(lián)服務(wù)最大限度的帶到用戶身邊。其關(guān)注于語(yǔ)音應(yīng)用服務(wù)的開發(fā)和實(shí)現(xiàn),將為為移動(dòng)互聯(lián)和信息服務(wù)帶來(lái)巨大影響。
4.1.提供了良好的用戶界面模型
作為最為親切友好的人機(jī)界面交互方式,語(yǔ)音應(yīng)用協(xié)議(VAP)為電話終端以及其它終端提供了遨游信息世界良好的擁護(hù)界面。傳統(tǒng)的鍵盤、鼠標(biāo)和屏幕為自然對(duì)話的交互方式所代替。語(yǔ)音應(yīng)用協(xié)議(VAP)不僅僅通過(guò)語(yǔ)音交互協(xié)議、語(yǔ)音標(biāo)記語(yǔ)言、對(duì)話標(biāo)記語(yǔ)言和語(yǔ)音瀏覽器規(guī)范等定義了“說(shuō)”和“聽”的交互界面,而且語(yǔ)音應(yīng)用協(xié)議(VAP)使用已有的Internet模型作為起點(diǎn),提供了和在傳統(tǒng)PC機(jī)的瀏覽器一樣熟悉的Web瀏覽習(xí)慣。
同時(shí)通過(guò)數(shù)據(jù)轉(zhuǎn)換協(xié)議、語(yǔ)音控制協(xié)議等協(xié)議,提供了兼容WAP的電話鍵盤輸入的界面。而可以內(nèi)嵌于智能終端設(shè)備中的語(yǔ)音控制器和微型語(yǔ)音瀏覽器,可以使用戶不僅以對(duì)話方式獲取信息和服務(wù),而且可以用語(yǔ)音指揮終端設(shè)備,做到“聽、說(shuō)、看”的全面交互。
4.2.提供了語(yǔ)音技術(shù)與信息技術(shù)的集成規(guī)范
語(yǔ)音應(yīng)用協(xié)議(VAP)中,語(yǔ)音網(wǎng)關(guān)(Voice Gateway)中制定的語(yǔ)音瀏覽器規(guī)范,作為應(yīng)用協(xié)議的語(yǔ)音標(biāo)記語(yǔ)言的解釋器,語(yǔ)音瀏覽器解析 Voice XML 所描述的應(yīng)用。而作為語(yǔ)音識(shí)別語(yǔ)法描述規(guī)范的JSGF規(guī)范和VAP語(yǔ)音識(shí)別引擎接口規(guī)范(基于JSAPI和SAPI)使人機(jī)間的交互以一種自然的,對(duì)話式的方式進(jìn)行。語(yǔ)音應(yīng)用協(xié)議(VAP)的這些規(guī)范對(duì)于對(duì)話瀏覽和語(yǔ)音識(shí)別、合成引擎之間的工作和數(shù)據(jù)交換等集成電路工作提供了標(biāo)準(zhǔn)。而語(yǔ)音瀏覽器、語(yǔ)音合成、識(shí)別引擎、CTI平臺(tái)之間的集成開發(fā)工作變得輕松而規(guī)范。
4.3.提供了安全的連接
語(yǔ)音應(yīng)用協(xié)議(VAP)對(duì)語(yǔ)音認(rèn)證、語(yǔ)音數(shù)字簽名等安全制定了協(xié)議,使語(yǔ)音應(yīng)用和語(yǔ)音電子商務(wù)的交易和安全更有保障。在基于Web機(jī)制的Transport Layer Security (TLS)協(xié)議基礎(chǔ)上,語(yǔ)音引協(xié)議(VAP)增加了在電話網(wǎng)絡(luò)中基于語(yǔ)音數(shù)據(jù)的安全機(jī)制以及基于個(gè)人聲紋認(rèn)證的安全驗(yàn)證。在語(yǔ)音應(yīng)用協(xié)議(VAP)中,語(yǔ)音網(wǎng)關(guān)(Voice Gateway)自動(dòng)的高度覺(jué)察性的管理數(shù)據(jù)安全。
4.4.提供了容易簡(jiǎn)單的應(yīng)用開發(fā)機(jī)制和工具
利用語(yǔ)音標(biāo)記語(yǔ)言(Voice XML),用開發(fā)HTML頁(yè)面和Web應(yīng)用的方式就可以簡(jiǎn)單的開發(fā)復(fù)雜的語(yǔ)音應(yīng)用。Voice XML 是一種XML文檔語(yǔ)言,其與數(shù)據(jù)庫(kù)、HTML、WML以及其它文檔處理和發(fā)布系統(tǒng)的資料交換幾乎沒(méi)有障礙。而語(yǔ)音應(yīng)用協(xié)議(VAP)中使用http協(xié)議作為語(yǔ)音網(wǎng)關(guān)(Voice Gateway)與語(yǔ)音服務(wù)器(Voice Server)之間的通訊協(xié)議,所以在Web所能使用的CGI、Perl、ASP等動(dòng)態(tài)數(shù)據(jù)機(jī)制同樣適用于語(yǔ)音應(yīng)用。而語(yǔ)音應(yīng)用交換方式基于java 的設(shè)計(jì),使Jsp 這樣的動(dòng)態(tài)數(shù)據(jù)機(jī)制可以更容易的應(yīng)用于語(yǔ)音應(yīng)用。
五 獲益者
語(yǔ)音應(yīng)用協(xié)議(VAP)不僅僅使廣大電話和手機(jī)用戶獲得輕松快捷享受信息服務(wù)和移動(dòng)互聯(lián)服務(wù),而且為整個(gè)社會(huì)和信息產(chǎn)業(yè)帶來(lái)更大的效益。
5.1.服務(wù)提供商的獲益
不僅僅信息服務(wù)的提供商可以為他們現(xiàn)有的信息服務(wù)系統(tǒng)增加語(yǔ)音應(yīng)用服務(wù)和龐大的用戶群,而且電信運(yùn)行商將從語(yǔ)音應(yīng)用為他們帶來(lái)的增值服務(wù)中獲得巨大收益。語(yǔ)音應(yīng)用的普及和推廣,必然使語(yǔ)音話務(wù)通訊的數(shù)量大大增加。而個(gè)性化的自然親切的語(yǔ)音應(yīng)用,將為服務(wù)提供商帶來(lái)巨大的新的服務(wù)內(nèi)容和語(yǔ)音電子商務(wù)行為。
而依靠Voice XML和對(duì)話標(biāo)記語(yǔ)言(Dialog-ML),服務(wù)提供商可以用開發(fā)Web服務(wù)一樣簡(jiǎn)單的方式開發(fā)他們的語(yǔ)音應(yīng)用,并可以輕松發(fā)布和維護(hù)。而語(yǔ)音應(yīng)用協(xié)議(VAP)帶來(lái)電話服務(wù)語(yǔ)音應(yīng)用(例如個(gè)人撥號(hào)服務(wù)、電話會(huì)議、電話遠(yuǎn)程管理等)將為電信服務(wù)商帶來(lái)巨大商機(jī)。
5.2.設(shè)備廠商的獲益
集成語(yǔ)音應(yīng)用協(xié)議(VAP)中語(yǔ)音控制器的智能終端,以及內(nèi)嵌微型語(yǔ)音瀏覽器的信息終端設(shè)備,將為設(shè)備生產(chǎn)廠商帶來(lái)新的產(chǎn)品和收入。而智能語(yǔ)音家電設(shè)備、遠(yuǎn)端控制設(shè)備等將更為廣大用戶所關(guān)注。語(yǔ)音應(yīng)用協(xié)議(VAP)產(chǎn)生了大量新的語(yǔ)音應(yīng)用的產(chǎn)品,將為設(shè)備廠商帶來(lái)廣闊的市場(chǎng)。
5.3.開發(fā)商的收益
語(yǔ)音應(yīng)用的開發(fā)商也許將無(wú)法估計(jì)他們從語(yǔ)音應(yīng)用中獲得的收益,以語(yǔ)音應(yīng)用協(xié)議(VAP)為工業(yè)標(biāo)準(zhǔn)而進(jìn)行開發(fā),他們將能輕松的開發(fā)各種各樣的豐富的語(yǔ)音應(yīng)用系統(tǒng)。而作為語(yǔ)音技術(shù)產(chǎn)品的開發(fā)商,如語(yǔ)音識(shí)別、語(yǔ)音合成引擎的開發(fā)商,語(yǔ)音瀏覽器開發(fā)商,語(yǔ)音網(wǎng)關(guān)開發(fā)商等等,他們將不再需要自己解決語(yǔ)音應(yīng)用系統(tǒng)中的所有其它他們不關(guān)心的部分,統(tǒng)一的規(guī)范使他們可以自由的選擇其它部分配合自己的開發(fā)。而語(yǔ)音應(yīng)用協(xié)議(VAP)也為開發(fā)商帶來(lái)了簡(jiǎn)單的開發(fā)規(guī)范和工具。
六 未來(lái)展望
我們可以預(yù)見,在不久的將來(lái)電話作為信息訪問(wèn)的終端將遠(yuǎn)遠(yuǎn)超過(guò)電腦的數(shù)量。語(yǔ)音應(yīng)用技術(shù)將成為統(tǒng)一信息、統(tǒng)一網(wǎng)絡(luò)的移動(dòng)互聯(lián)中的重要技術(shù)成分。作為高科技的網(wǎng)絡(luò)信息對(duì)廣大的中國(guó)百姓將不在神秘,中國(guó)百姓將隨時(shí)隨地在對(duì)電話機(jī)或手機(jī)說(shuō)話,享受語(yǔ)音應(yīng)用技術(shù)為他們帶來(lái)的美好服務(wù)。
基于VoiceXML 的應(yīng)用系統(tǒng)規(guī)范提綱(征求意見稿 2001-11-12 |
語(yǔ)音互聯(lián)再造Internet 2001-10-22 |
語(yǔ)音系統(tǒng)開發(fā)的新平臺(tái):VoiceXML瀏覽器 2001-10-19 |
TTS與語(yǔ)音識(shí)別軟件 2001-09-21 |
Office XP中文語(yǔ)音功能的開發(fā) 2001-09-13 |