首頁(yè)>>廠商>>語(yǔ)音識(shí)別與合成>>捷通華聲

捷通華聲推出OSR語(yǔ)音識(shí)別技術(shù)

2004/09/30

  北京捷通華聲語(yǔ)音技術(shù)有限公司與美國(guó) ScanSoft 公司( Nasdaq :SSFT ),于2004 年5月20日,就雙方語(yǔ)音技術(shù)全面合作達(dá)成戰(zhàn)略聯(lián)盟,此國(guó)際合作聯(lián)盟旨在共同推動(dòng)國(guó)際語(yǔ)音產(chǎn)業(yè)的發(fā)展,加速中國(guó)語(yǔ)音技術(shù)產(chǎn)業(yè)化發(fā)展進(jìn)程。2004年9月,捷通華聲在國(guó)內(nèi)正式推出ScanSoft國(guó)際最高水平語(yǔ)音識(shí)別技術(shù)OSR(OpenSpeech Recognizer )

  之所以稱之為OSR,是因?yàn)榇隧?xiàng)語(yǔ)音識(shí)別技術(shù)是一種基于開放標(biāo)準(zhǔn)、可擴(kuò)展、高性能和高識(shí)別率的識(shí)別引擎,提供大詞匯量、非特定人、連續(xù)的語(yǔ)音識(shí)別功能,尤其是在各種無(wú)限環(huán)境之中對(duì)于噪雜音的處理功能強(qiáng)大。OSR產(chǎn)品將以SDK的方式提供給集成商,可廣泛應(yīng)用在呼叫中心、自動(dòng)總機(jī)、語(yǔ)音電話本、旅行預(yù)定、信息檢索、語(yǔ)音門戶和客戶自助服務(wù)等系統(tǒng)中。

  捷通華聲與ScanSoft公司強(qiáng)強(qiáng)聯(lián)手,將捷通華聲中文語(yǔ)音合成技術(shù)與ScanSoft公司最新語(yǔ)音識(shí)別技術(shù)OSR全面整合,形成完整的語(yǔ)音技術(shù)解決方案以利于國(guó)內(nèi)、國(guó)際語(yǔ)音技術(shù)市場(chǎng)的廣泛應(yīng)用,使產(chǎn)品更加貼近用戶需求,更好的滿足市場(chǎng)需要。

一、Scansoft公司介紹:

  美國(guó) ScanSoft 公司 (Nasdaq: SSFT) 是一家全球知名的國(guó)際性企業(yè),是專業(yè)的語(yǔ)音和圖像解決方案供應(yīng)商,特別是其語(yǔ)音識(shí)別引擎,在識(shí)別率、識(shí)別速度、系統(tǒng)穩(wěn)定性等方面都處于行業(yè)領(lǐng)先的地位,在通信、遠(yuǎn)程信息處理、移動(dòng)終端等諸多領(lǐng)域有著廣泛的應(yīng)用,市場(chǎng)遍布全球。伴隨語(yǔ)音產(chǎn)業(yè)在全球的的快速發(fā)展,ScanSoft 公司高瞻遠(yuǎn)矚,以雄厚的實(shí)力、果斷的行動(dòng)在兩年之內(nèi)兼并了 L&H ( Dragon ), SpeechWorks 兩家歐洲與美國(guó)的實(shí)力雄厚的國(guó)際知名語(yǔ)音技術(shù)公司,并成功收購(gòu)飛利浦語(yǔ)音實(shí)驗(yàn)室,建立了其在國(guó)際語(yǔ)音識(shí)別技術(shù)最大的市場(chǎng)份額。

二、OSR主要特點(diǎn):

1、高識(shí)別率
  OSR產(chǎn)品核心技術(shù)顯著提高,并且極大的提高置信得分的準(zhǔn)確度,使實(shí)際應(yīng)用中識(shí)別率均達(dá)到95%以上,對(duì)于小詞匯量的應(yīng)用識(shí)別率更高。

2、強(qiáng)大的語(yǔ)法分析功能
  OSR產(chǎn)品支持百萬(wàn)詞匯的復(fù)雜語(yǔ)法應(yīng)用,利用SpeekFreely技術(shù)還可支持自然語(yǔ)言問(wèn)答式的語(yǔ)法識(shí)別。利用OSR的先進(jìn)語(yǔ)法處理能力,用戶可以利用ECMA腳本語(yǔ)言書寫更復(fù)雜的語(yǔ)法,可以創(chuàng)建動(dòng)態(tài)的應(yīng)用,并具支持共享語(yǔ)法,大幅度提高系統(tǒng)效率。

3、獨(dú)特的語(yǔ)音端點(diǎn)檢測(cè)技術(shù)
  OSR包括魯棒的端點(diǎn)檢測(cè)算法,可以依據(jù)振幅和頻譜特征來(lái)進(jìn)行檢測(cè),從而有效地區(qū)分背景噪音和通話者的語(yǔ)音。OSR端點(diǎn)檢測(cè)的"靈敏度"可以被手動(dòng)調(diào)整,以適應(yīng)安靜或喧鬧的不同環(huán)境,或在應(yīng)用中微調(diào)性能。

4、適應(yīng)性強(qiáng)
  通過(guò)ScanSoft具有專利技術(shù)的自動(dòng)調(diào)節(jié)機(jī)制"LEARN"學(xué)習(xí)功能,系統(tǒng)可以自動(dòng)調(diào)節(jié)識(shí)別參數(shù)和聲學(xué)模型,以適應(yīng)呼叫人群的本地方言、區(qū)域口音和電話信道等特點(diǎn)。通過(guò)"LEARN"自動(dòng)調(diào)節(jié)機(jī)制,識(shí)別錯(cuò)誤率可以下降70%。

5、高性能、低資源消耗
  獨(dú)特的音頻分析方法及具有專利的有限狀態(tài)轉(zhuǎn)換技術(shù),使OSR產(chǎn)品在實(shí)際應(yīng)中,內(nèi)存占用和CPU的消耗極低。對(duì)于復(fù)雜的語(yǔ)法應(yīng)用可以節(jié)約90%的資源。

6、高容量并發(fā)
  OSR產(chǎn)品支持高容量的并發(fā)呼叫,一個(gè)中等應(yīng)用(2000詞匯以內(nèi)),至強(qiáng)單CPU 2.4G的配置環(huán)境下,可以支持60個(gè)并發(fā)的語(yǔ)音識(shí)別端口。

7、支持開放標(biāo)準(zhǔn)
  OSR產(chǎn)品是根據(jù)VoiceXML設(shè)計(jì)的,對(duì)SRGS(Speech Recognition Grammar Specification,語(yǔ)音識(shí)別語(yǔ)法規(guī)范)的支持等特點(diǎn)使VoiceXML 和 SALT 應(yīng)用達(dá)到最優(yōu)狀態(tài)。

8、支持多語(yǔ)言,包括多語(yǔ)言混合識(shí)別
  OSR產(chǎn)品目前提供15種語(yǔ)言和方言,包括:普通話(中國(guó)大陸、臺(tái)灣)、粵語(yǔ)(香港地區(qū))、英語(yǔ)(澳大利亞、新西蘭、英國(guó)、美國(guó)、新加坡)、法語(yǔ)(法國(guó)、加拿大)、德語(yǔ)(德國(guó))、日語(yǔ)(日本)、韓語(yǔ)(韓國(guó))、西班牙語(yǔ)(美國(guó)、墨西哥)。

  OSR產(chǎn)品的WorldAware功能支持多語(yǔ)種的混合識(shí)別,甚至允許單個(gè)語(yǔ)句中的任意語(yǔ)言混合,可以用于構(gòu)造更加復(fù)雜的語(yǔ)音解決方案。

9、多種體系結(jié)構(gòu)選擇
  OSR產(chǎn)品提供多種體系結(jié)構(gòu)組合方式:
  1)單機(jī):用戶可以直接在運(yùn)行IVR的機(jī)器上加載OSR。
  2)客戶端/服務(wù)器:用戶可以直接在服務(wù)器端加載OSR,客戶端通過(guò)網(wǎng)絡(luò)發(fā)送語(yǔ)音信號(hào)并獲取識(shí)別結(jié)果。
  3)VoIP:用戶也可以在一個(gè)基于VoIP的客戶端/服務(wù)器架構(gòu)中配置OSR,在這種情況下,客戶端是一個(gè)VoIP媒體網(wǎng)關(guān)或媒體服務(wù)器,服務(wù)器是MRCP版本的OpenSpeech服務(wù)器,它提供了帶有標(biāo)準(zhǔn)的VoIP協(xié)議接口的OSR。

10、支持多種操作系統(tǒng)
  OSR可在下列操作系統(tǒng)下使用單機(jī)和客戶端/服務(wù)器配置:
  客戶端操作系統(tǒng):RedHat 7.2、RedHat AS 2.1、Windows 2000、Windows 2003。
  服務(wù)端操作系統(tǒng):RedHat 7.2、RedHat AS 2.1、Windows 2000、Windows 2003、Solaris。

三、配置要求:

詞匯量 運(yùn)行系統(tǒng) 硬件環(huán)境 可支持端口數(shù)
2000以下 Windows 2000以上 至強(qiáng)雙CPU 2.4G;1G以上內(nèi)存,20G硬盤;100M以上網(wǎng)卡; 120線
40000以下 Windows 2000以上 至強(qiáng)雙CPU 2.4G;1G以上內(nèi)存,20G硬盤;100M以上網(wǎng)卡; 60線


四、OSR語(yǔ)音識(shí)別技術(shù)應(yīng)用案例:

  美國(guó)聯(lián)合航空(United Airlines):客戶通過(guò)致電1(800)824-6200,應(yīng)用OSR語(yǔ)音識(shí)別技術(shù)可方便查詢聯(lián)合航空公司每天2400個(gè)航班的狀態(tài),每天有8萬(wàn)多人使用這一系統(tǒng)。

  AOL電話服務(wù):采用Scansoft OSR等語(yǔ)音技術(shù),為America Online的2400萬(wàn)客戶開發(fā)和部署了語(yǔ)音門戶服務(wù)。

  Thrifty汽車租賃:Thrifty租車公司是全球最大的的租車公司之一,通過(guò)撥打Thrifty的1-800-THRIFTY預(yù)訂電話號(hào)碼,客戶在應(yīng)用OSR語(yǔ)音識(shí)別技術(shù)獲得高效服務(wù)的同時(shí),也獲得最優(yōu)惠的汽車租用費(fèi)率。

捷通華聲公司供稿 CTI論壇編輯



相關(guān)鏈接:
捷通華聲發(fā)布jASR5.5 ASR價(jià)格面前將無(wú)怯步 2008-04-16
捷通華聲TTS成功登陸中國(guó)郵政儲(chǔ)蓄銀行 2008-04-03
捷通華聲 jTTS 5.5 全面支持 MRCPv2標(biāo)準(zhǔn) 2008-03-31
捷通華聲移動(dòng)導(dǎo)航HCI解決方案廣受青睞 2008-03-26
身邊的“智能”生活 2007-12-28

分類信息:  語(yǔ)音合成TTS_與_語(yǔ)音識(shí)別ASR     新聞?lì)l道   技術(shù)_語(yǔ)音應(yīng)用_新聞   技術(shù)_語(yǔ)音應(yīng)用_新聞