首頁>>廠商>>語音識別與合成>>Nuance

3G時代語音識別成本仍然是“攔路虎”

2009/06/10

  “跑遍了京城的兒童玩具市場,竟然找不到幾款能夠順利完成語音對話的玩具娃娃”,這是六一前夕記者遭遇到的尷尬。無獨有偶,此前中科院自動化所以31萬元的價格,為四川科技館定做的能根據(jù)人類語音命令來完成畫像的特種機(jī)器人“貝奇”,可惜只是展示和娛樂觀眾。

  中國已經(jīng)進(jìn)入了3G元年,整個通信產(chǎn)業(yè)以高速度前進(jìn),兒童玩具市場作為全球最大的消費市場,其語音技術(shù)應(yīng)用如此稀缺,產(chǎn)業(yè)鏈的企業(yè)是不是該反思反思。根據(jù)記者調(diào)查,目前最大的問題還是投入過高,回報甚微。

  鄭裕慶

  “一直以來,語音控制模塊的成本因素似乎都是阻礙語音識別技術(shù)接近普通消費者的“攔路虎!盢uance大中華區(qū)總經(jīng)理鄭裕慶告訴《通信產(chǎn)業(yè)報》(網(wǎng))記者。

  Nuance全球?qū)ふ彝黄瓶?/strong>

  鄭裕慶對《通信產(chǎn)業(yè)報》(網(wǎng))記者表示,“早在三年前我們已經(jīng)和索尼公司合作,進(jìn)軍到了兒童電子玩具市場。由于兒童玩具語音對話功能涉及到產(chǎn)業(yè)鏈的數(shù)個企業(yè),而且成本較高,因此,目前這個市場處于雛形階段,今后開發(fā)前景大有可為”。

  Nuance移動-企業(yè)事業(yè)部及消費者服務(wù)事業(yè)部總裁史蒂夫·錢伯斯告訴《通信產(chǎn)業(yè)報》(網(wǎng))記者,語音識別技術(shù)在世界上許多國家都有其應(yīng)用,目前,全球超過2/3的財富100強(qiáng)企業(yè)采用了Nuance的解決方案,超過2.5億臺設(shè)備內(nèi)置了Nuance移動語音處理設(shè)備。

史蒂夫·錢伯斯

  在通信領(lǐng)域,包括AT&T、Verizon、LG電子、諾基亞、摩托羅拉,在終端上都載入了語音識別的技術(shù),在航空方面應(yīng)也比較廣泛。如今,包括美國航空公司在內(nèi)全球多家航空公司采用了語音識別系統(tǒng)軟件。

  業(yè)內(nèi)人士分析,語音識別技術(shù)有兩個方向:一是大詞匯量連續(xù)語音識別系統(tǒng),主要應(yīng)用于計算機(jī)的聽寫機(jī),以及與電話網(wǎng)或者互聯(lián)網(wǎng)相結(jié)合的語音信息查詢服務(wù)系統(tǒng),這些系統(tǒng)都是在計算機(jī)平臺上實現(xiàn)的;另外一個重要的方向是小型化、便攜式語音產(chǎn)品的應(yīng)用,如手機(jī)撥號、汽車設(shè)備的語音控制、智能玩具、家電遙控等方面的應(yīng)用,這些應(yīng)用系統(tǒng)大都使用專門的硬件系統(tǒng)實現(xiàn)。近幾年來迅速發(fā)展的語音信號處理專用芯片和語音識別片上系統(tǒng)的出現(xiàn),為語音識別的廣泛應(yīng)用創(chuàng)造了有利的條件。

  中國市場方興未艾

  目前,語音識別技術(shù)在中國金融系統(tǒng)應(yīng)用曙光初現(xiàn)。

  “語音軟件目前應(yīng)用屬于初級階段。主要是大多是手機(jī)銀行和電話銀行根據(jù)用戶的聲音辨別真?zhèn)。估計今后可能拓展到更寬泛的領(lǐng)域”。中國建設(shè)銀行數(shù)據(jù)服務(wù)中心的負(fù)責(zé)人表示,語音軟件在身份認(rèn)證、賬單支付、個人數(shù)據(jù)修復(fù)等應(yīng)用效果明顯。

  目前,通過語音識別技術(shù)在中國移動增值業(yè)務(wù)上有所突破。此前,江蘇移動、山東移動等電信運營商,已經(jīng)實現(xiàn)了用戶通過“哼”一段旋律,就能查找到自己聽過卻不知道名稱的歌曲或彩鈴,并且進(jìn)行點播和下載的新業(yè)務(wù)。
  
  “這種大規(guī)模的商業(yè)應(yīng)用,已經(jīng)進(jìn)入了成熟階段!敝锌圃郝晫W(xué)所語音實驗室有關(guān)人士表示,在商業(yè)應(yīng)用上,這套系統(tǒng)最關(guān)鍵的部分是解決了計費環(huán)節(jié)的問題,電信運營商和聲學(xué)所,由此可以按照每條查詢的下載量來進(jìn)行按比例分賬。

  “中國擁有超過近8億移動用戶,占全球最大的流動電話市場!卞X伯斯對中國的3G市場充滿了期待。據(jù)其透露,Nuance目前已和包括中國銀行在內(nèi)六家銀行達(dá)成了協(xié)議,未來語音系統(tǒng)將全面發(fā)力中國市場!

  語音識別技術(shù)壁壘猶存

  據(jù)媒體報道,2006年,中國電信推出的號碼百事通新業(yè)務(wù),就是一款整合用戶號碼信息的基礎(chǔ)上,針對用戶的模糊查詢等信息服務(wù)需求提供的新產(chǎn)品。可惜的是模糊查詢,效果不佳,現(xiàn)行的“號碼百事通”業(yè)務(wù)還需要靠人工接線來實現(xiàn),這必然需要投入大量資金來建設(shè)和不斷完善呼叫中心。

  錢伯斯表示,今后將加大中國市場的開拓力度和在中國的投入,今年Nuance中國的員工將增加一倍,并加大研發(fā)力度,提高中國語言識別的準(zhǔn)確率。

  目前,國際上Google和微軟在語音識別技術(shù)上競爭激烈。世界上只有少數(shù)幾家公司能夠形成核心技術(shù),而中科院聲學(xué)所是國內(nèi)唯一完全擁有核心自主技術(shù)的單位,目前其最大的競爭對手主要是美國的Nuance公司。

  在金融危機(jī)仍籠罩全球之時,恰逢中國3G元年,語音識別技術(shù)的應(yīng)用將是一個千載難逢的機(jī)會。但是,突破這個壁壘也需要一個長期的過程。

通信產(chǎn)業(yè)網(wǎng)

海盐县| 忻州市| 德惠市| 赣州市| 青铜峡市| 玉环县| 苍梧县| 大庆市| 额济纳旗| 益阳市| 全椒县| 惠州市| 贵定县| 泰州市| 婺源县| 封丘县| 五指山市| 屏南县| 额尔古纳市| 措美县| 宜宾县| 桐梓县| 太原市| 涿州市| 嘉荫县| 昂仁县| 南召县| 宜宾县| 白山市| 疏附县| 大安市| 会同县| 孟连| 潍坊市| 文成县| 阳信县| 砚山县| SHOW| 黄山市| 渭源县| 莫力|