首頁>>廠商>>系統(tǒng)集成及應用軟件開發(fā)商>>廣州新太科技公司

國內IVR應用語音識別還不多

彭凌哲 2000/12/07

  目前的語音識別系統(tǒng)分為兩種:一種是面向計算機個人用戶的,一般安裝在用戶的個人計算機上;另一種是面向CTI領域的,主要是使CTI應用系統(tǒng)能夠實現(xiàn)語音識別功能。


  ■CTI對語音識別提高要求


  應用于CTI領域的語音識別技術有別于一般PC機系統(tǒng)所使用的語音識別技術,其面臨的困難體現(xiàn)為:電話錄音質量差,識別率要求高,系統(tǒng)不能對電話用戶進行訓練;另外,系統(tǒng)還要能夠完成大量用戶語音數(shù)據(jù)的并發(fā)識別請求,這就對應用于CTI領域的語音識別技術在功能和性能上要有更高要求。

  由于存在上面列舉的種種困難,使得應用于CTI領域的ASR技術不可能像應用于PC機的ASR技術一樣,能夠隨心所欲地識別用戶所說的任何詞匯。因此,目前應用于CTI領域的ASR技術是一種基于詞匯和語法的識別技術。對于一個CTI應用系統(tǒng),需要根據(jù)系統(tǒng)需求設計一種語法,語法必須包括與用戶交互時用戶所有可能的語音輸入,而詞匯就來自于語法中所有可能出現(xiàn)的單詞。不同的ASR廠商還會加入一些增強性的功能,如barge-in打斷功能、自然語言理解等等。


  ■語音識別拓展CTI應用


  ASR技術給CTI領域帶來了更加廣闊的前景。以往用戶使用電話接入時,與系統(tǒng)進行交互就只能通過電話按鍵或人工服務進行交互,對于復雜的系統(tǒng),如郵政編碼查詢、天氣預報、航班查詢等,如果使用按鍵表示的話,用戶根本無法記住這些表示,而只能通過人工服務進行查詢。像傳統(tǒng)的168信息服務,由于只能使用按鍵進行服務,用戶又無法記住如此之多的號碼及功能選項數(shù)字,大大降低了使用168信息服務的用戶。而使用人工服務,又增加了系統(tǒng)運營商的運營成本。

  ASR技術的出現(xiàn)必將改變這一情況。通過語音識別技術,CTI系統(tǒng)可以實現(xiàn)讓用戶使用語音與系統(tǒng)進行自動交互,如用戶要查詢城市天氣情況,只需說出城市名稱;要查詢航班情況,只需說出目的地城市;要查詢股票價格,只需說出該股票的名稱。再結合TTS(Text To Speech文本轉語音)技術,CTI系統(tǒng)可以提供非常強大的電話自動交互系統(tǒng)。

  目前ASR技術與CTI的結合在國外已有大量實際應用的實例,國外許多大公司,其電話總機系統(tǒng)大都采用了ASR技術。外線接入時,無需撥打分機號碼,只需要說出要找的人的姓名或辦公室名稱即可。更大規(guī)模的應用如企業(yè)黃頁查詢、客戶服務中心,ASR技術已得到越來越多實踐。


  ■IVR用語音識別還不多


  目前主要的ASR廠商,國外的主要有飛利浦、Nuance、IBM等,國內的有香港特區(qū)的InfoTalk等。各個廠商都提供了多個層次的開發(fā)包及相關開發(fā)工具,實現(xiàn)的功能及效果也大致相近,但在細節(jié)上也存在許多差異。相比之下,Nuance公司的產(chǎn)品顯得功能更齊全,性能更優(yōu);而InfoTalk的產(chǎn)品則中文本土化的程度更高,在中文識別上絲毫不遜色。

  新太科技一直密切關注ASR技術的發(fā)展,早在1999年10月,新太科技就與飛利浦公司在語音識別技術上簽定了合作協(xié)議。在今年又先后與Nuance和InfoTalk公司達成了合作意向。新太科技使用當今世界最先進的ASR/TTS技術,已開發(fā)出了一系列全新的應用系統(tǒng),并將在未來結合語音互聯(lián)網(wǎng)進行全面的應用推廣。

《賽迪市場專家》 2000/12/07


分類信息:  交互語音_與_語音識別ASR     技術_交互語音_文摘   技術_語音識別_文摘