CTI論壇: 無線語音門戶只是個過渡

首頁>>>技術>>>語音應用>>>語音識別(ASR)　　語音識別產品

無線語音門戶只是個過渡

2000/11/16

　　移動Internet是近年業(yè)界傾力發(fā)展的目標之一，為了更好地滿足人們“隨時隨地”的Internet接入與訪問需求，業(yè)界進行了不懈的努力，在WAP出師不利、下一代3G無線技術“猶抱琵琶半遮面”之際，以Tellme、TelSurf網絡與BeVocal等公司為先導的無線語音門戶技術又在業(yè)界嶄露頭角，意欲擔當起無線Web訪問的大任。

　　與Web門戶集多種服務信息于一身的模式類似，在語音門戶中用戶也能夠借助語音命令獲得諸如天氣、新聞或體育等多方面的信息，其中無線語音門戶同樣也是基于移動電話為主的便攜移動平臺提供Web信息訪問服務，所不同的是無線數據技術帶寬較窄、用戶界面使用不夠理想的。無線語音門戶可以通過語音撥號及語音識別借助語音驅動命令而非鍵盤實現Web訪問，并借助語音合成技術獲得所需的信息，部分地克服了無線數據訪問由于移動電話屏幕狹小、分辨率低及鍵盤輸入不便等造成的訪問效果不夠理想的缺憾。

　　盡管這一技術構想頗為誘人，并吸引了包括AOL、Qwest等網絡與通信業(yè)巨頭的加盟與眾多消費者的興趣，但就本質而言，這一技術與WAP相比，并未有多少實質性進展，僅在用戶界面上進行了一些并非十分成功的調整。因此，這一技術同樣將會陷入業(yè)內專家稱頌、消費者不買賬的如同WAP協議類似的“叫好不叫座”的窘境。

　　作為無線數據訪問服務的一種變體，無線語音門戶依然需要依賴于現有的無線網絡架構。現有無線網絡架構存在的種種限制同樣將會成為無線語音門戶技術難以逾越的鴻溝，如現有無線數據網絡的傳輸速率也同樣會影響到語音處理的速度，成為語音門戶發(fā)展的制約因素。

　　顧名思義，無線語音門戶的服務質量將在很大程度上依賴于語音識別與語音合成技術的進展。而事實上，目前的語音識別技術遠未達到人們預期的水平，即使是業(yè)內主流語音識別系統(tǒng)的識別正確率也與人們的期望值相去甚遠，更不要說實現以語音命令為主的網站訪問導航。例如，不經意的咳嗽聲可能會被語音識別系統(tǒng)誤認作語音命令而將用戶引導至一個風馬牛不相及的網站或輸出令人啼笑皆非的服務信息。具體至我國這樣一個民族眾多、方言土語數不勝數的泱泱大國，無線語音門戶技術應用的難度與挑戰(zhàn)更是可想而知。與此同時，擔當信息輸出重任的語音合成技術在語速與語調上同樣存在不盡如人意之處，帶有明顯的空洞、呆板、干澀現象，難以引發(fā)人們的興致。有人曾在實驗室做過一項實驗，讓語音合成與語音識別系統(tǒng)進行對話，結果識別速度僅能達到每秒2比特左右。因此，語音識別與合成技術目前僅能達到勉強可以忍受的水平，期望這樣一種不夠成熟的技術擔當起市場主流無疑是極不現實的。

　　此外，一種技術的成功很大程度上還需依賴于市場的廣泛認同與參與，無線語音門戶在這方面同樣存在先天不足，目睹了WAP技術難如人意的消費者短期內注定不會對無線語音門戶趨之若鶩，而是持懷疑、觀望心態(tài)者居多。同時，在側畔相機而動的3G技術也將成為無線語音門戶技術發(fā)展的勁敵，讓語音門戶貼上“過渡性技術”的標簽，陷入進退維谷的尷尬境地。

　　在我國，無線連接費用更會進一步挫傷包括無線語音門戶在內的無線訪問技術的應用，不菲的價格把會將廣大“布衣階層”拒之門外，WAP技術在我國的應用就是一個典型的例證。

　　總之，作為無線數據訪問之外的又一無線Internet訪問技術，無線語音門戶仍難跳出目前眾多移動Internet技術的窠臼，仍不同程度地受到語音識別與合成技術、系統(tǒng)訪問平臺及網絡架構等多種軟、硬件資源的限制，難以擔當無線網絡訪問大任，至多僅能作為一種可與WAP等無線數據訪問技術分庭抗禮、下一代3G技術來臨之前的過渡性技術而已。

《賽迪市場專家》2000/11/16

分類信息: 技術_語音識別_文摘