首頁>>廠商>>語音板卡開發(fā)商>>Aculab

Aculab的ASR (自動(dòng)語音識(shí)別 ) 技術(shù)

2004/05/08

  對(duì)于那些需要把語音識(shí)別(ASR)技術(shù)引入交互式應(yīng)答應(yīng)用領(lǐng)域的開發(fā)商而言,Aculab的基于音素的語音識(shí)別引擎是理想的選擇。該引擎能把說出的詞或短語與語法規(guī)則匹配,確定識(shí)別結(jié)果。Aculab的基于主機(jī)的語音識(shí)別引擎性能卓越,而且是免費(fèi)使用的。

  由于采用的是音素模型,所以用戶能方便地通過增加發(fā)音字典的條目,來定義和擴(kuò)展識(shí)別詞匯表。

  采用該識(shí)別引擎的系統(tǒng)結(jié)構(gòu)是完全可伸縮的:一個(gè)或多個(gè)ASR服務(wù)器可以接收并處理來自一個(gè)或多個(gè)客戶機(jī)的話音輸入,而且只有客戶機(jī)系統(tǒng)需要使用Prosody媒體處理資源卡。此外,ASR可以和Prosody板卡上的其他語音算法混合使用,來提供更多的選擇和靈活性。所有這一切,證明了Aculab對(duì)電話語音市場(chǎng)的一貫承諾:通過不斷地為Prosody板卡提供新功能特性,保證其無與倫比的價(jià)值。此外,這些功能都是通過Aculab的統(tǒng)一API實(shí)現(xiàn)的,配合全球范圍內(nèi)的電信協(xié)議支持和認(rèn)證,可以有效地加快應(yīng)用系統(tǒng)進(jìn)入市場(chǎng)的速度。

增強(qiáng)的語音識(shí)別
  Aculab的ASR識(shí)別速度快,準(zhǔn)確度高,在識(shí)別過程中能無縫地與混合的整字/單音素/多因素模型集成。據(jù)此,一句言辭的不同部分可以通過不同的方法得到處理,從而得到識(shí)別結(jié)果。對(duì)于連續(xù)字識(shí)別,準(zhǔn)確率高達(dá)97%。此外,為了處理易于混淆的被識(shí)別對(duì)象,系統(tǒng)還能給出帶有可信度數(shù)值的其他候選識(shí)別結(jié)果。

獨(dú)立于說話人
  為了適應(yīng)由于性別、年齡和口音等因素產(chǎn)生的聲音變異,在所有支持的語言里,Aculab都進(jìn)行了廣泛的語料分析。專用的語音信號(hào)分析算法確保了識(shí)別引擎的韌性,不受話機(jī)和電話線路質(zhì)量的影響。

自然地講話
  不常用的方言使得某些特定字詞的發(fā)音與規(guī)范不同。在此情況下,開發(fā)商可以通過編輯和添加發(fā)音字典的條目,來擴(kuò)展識(shí)別詞匯表。Aculab提供了方便易用的、基于Windows的詞典管理工具-ASRLexMan。一個(gè)特定的詞可以有多個(gè)不同的發(fā)音,來解決方言問題,提高識(shí)別的準(zhǔn)確率。

運(yùn)行時(shí)語法處理
  語法定義了被識(shí)別詞匯的范圍和在句子里可能出現(xiàn)的前后次序。該識(shí)別引擎采用的是Aculab語音語法格式(ASGF),ASGF是Java語音語法格式(JSGF)的一個(gè)子集。Aculab ASR中語法可以預(yù)先設(shè)定,也可以在運(yùn)行過程中根據(jù)用戶和應(yīng)用系統(tǒng)交互的需要或?yàn)檫m應(yīng)外部因素而隨時(shí)動(dòng)態(tài)定義。語法可以用基于Windows操作系統(tǒng)的管理工具ASRNetMan來編輯生成。

可擴(kuò)展的結(jié)構(gòu)
  由于高密度的Prosody板卡上的一個(gè)DSP可以支持多達(dá)64個(gè)通道被識(shí)別語音的饋入處理,所以通道容量指標(biāo)主要取決于ASR主機(jī)服務(wù)器的處理能力。使用額外的主機(jī)可以增加通道容量。ASR結(jié)構(gòu)的內(nèi)在靈活性,支持一個(gè)或多個(gè)識(shí)別服務(wù)器配置,所以能充分利用Prosody資源卡的強(qiáng)大處理能力。

支持的語言
  同一個(gè)語音識(shí)別軟件包,能同時(shí)處理多種語言,包括:英國英語、美國英語、法語、德語、意大利語、北美西班牙語、巴西葡萄牙語、和拉丁美洲西班牙語等。應(yīng)用中每次可以根據(jù)需要配置成不同語言的識(shí)別。

主機(jī)操作系統(tǒng)支持:Windows XP/2000,Linux和Sun SPARC Solaris。

可選的硬件
  基于主機(jī)的ASR應(yīng)用可以通過Aculab的PCI或cPCI格式的Prosody板卡的任意語音處理固件獲得輸入的話音信號(hào),所以允許ASR和其他基于DSP的語音處理算法并行使用,包括錄音/放音、回波抵消和DTMF檢測(cè)。這樣,在同一個(gè)硬件平臺(tái)上能支持多種語音處理技術(shù)。

  回波抵消功能是由Prosody固件提供的,它對(duì)實(shí)現(xiàn)人機(jī)自然交互非常重要。具體體現(xiàn)是支持"barge-in"功能,使得有經(jīng)驗(yàn)的呼叫用戶無需聽完完整的系統(tǒng)提示音,就可做出響應(yīng)。

同時(shí)支持文語轉(zhuǎn)換和說話人證實(shí)
  如果ASR和文語轉(zhuǎn)換(TTS)以及說話人證實(shí)和鑒別(SVI技術(shù))一起使用,開發(fā)商可以進(jìn)一步提高IVR和呼叫中心系統(tǒng)的性能。TTS和SVI都用Prosody板卡來提供話音回放的通道,而且是可以免費(fèi)獲得的。

通道容量
  典型地,采用單1.9GHz CPU的主機(jī)來擔(dān)當(dāng)客戶機(jī)、服務(wù)器以及控制器,可以同時(shí)支持120個(gè)并發(fā)的語音識(shí)別通道。

性能指標(biāo)和優(yōu)勢(shì)
·高識(shí)別準(zhǔn)確率
  是通過混合采用整字/單音素/多因素模型獲得的。
·可伸縮的系統(tǒng)結(jié)構(gòu)
  采用分布式服務(wù)器結(jié)構(gòu),方便系統(tǒng)功能或容量的擴(kuò)展。
·大通道容量
  能提升平均每通道資源處理的價(jià)值,有效減少硬件開銷。
·Aculab統(tǒng)一API
  易于系統(tǒng)集成,加快應(yīng)用程序進(jìn)入市場(chǎng)的速度。
·免費(fèi)的使用許可證
  意味著無需付費(fèi),就可以隨時(shí)隨地從Aculab的網(wǎng)站下載此軟件。
·用戶可定義的詞典
  ASRLexMan為開發(fā)商和系統(tǒng)集成商帶來使用過程中的靈活性。
·按字母拼讀規(guī)則
  當(dāng)一個(gè)詞在詞典里不存在時(shí),用作備選處理規(guī)則。
·標(biāo)準(zhǔn)的語法定義格式
  方便語法標(biāo)記和生成。
·運(yùn)行時(shí)語法處理
  支持靈活的人機(jī)對(duì)話流程設(shè)計(jì)和實(shí)現(xiàn)。
·脫機(jī)語法編輯
  ASRNetMan方便開發(fā)商和系統(tǒng)集成商創(chuàng)建靈活的應(yīng)用。
·與說話人無關(guān)
  意味著呼叫用戶使用應(yīng)用系統(tǒng)前,無需進(jìn)行訓(xùn)練。
·可能的選擇
  支持交互式系統(tǒng)設(shè)計(jì)的智能實(shí)現(xiàn)。
·識(shí)別結(jié)果的可信度
  每次識(shí)別完成之后都會(huì)返回該參數(shù)。此結(jié)果對(duì)出錯(cuò)情況下的處理有幫助。
·靜音檢測(cè)
  用來確認(rèn)一句言辭的起始端點(diǎn),最大限度減輕系統(tǒng)處理負(fù)荷。靜音檢測(cè)的相關(guān)參數(shù)可以通過API調(diào)整。
·回波抵消
  在Prosody板卡上實(shí)現(xiàn),來支持"barge-in"功能。

  預(yù)知更多信息,請(qǐng)聯(lián)系A(chǔ)culab的銷售代表或訪問我們的網(wǎng)站:http://www.aculab.com

Aculab公司供稿 CTI論壇編輯



相關(guān)鏈接:
Aculab增強(qiáng)對(duì)Asterisk商業(yè)版的支持 2006-11-21
信令與媒體網(wǎng)關(guān)GroomerII的卓越IP和SS7處理能力 2006-11-17
Aculab產(chǎn)品的七號(hào)信令監(jiān)控功能 2006-10-11
Aculab公司的最新產(chǎn)品研發(fā) 2006-09-19
Aculab發(fā)布最新產(chǎn)品——Prosody X PCIe板卡 2006-09-14

分類信息:  語音板卡_與_語音識(shí)別ASR     技術(shù)_語音板卡_新聞   技術(shù)_語音識(shí)別_解決方案   技術(shù)_語音板卡_文摘