亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

中科信利

中科信利關(guān)鍵詞識(shí)別引擎

2016-05-24 16:19:38   作者:   來源:CTI論壇   評(píng)論:0 點(diǎn)擊:


  在某些特定情況下,我們并不關(guān)心說話者所說的每一句話,只是想了解個(gè)大概的主題,這時(shí)關(guān)鍵詞檢測(cè)系統(tǒng)是理想的選擇。關(guān)鍵詞檢測(cè)是語音識(shí)別技術(shù)的一個(gè)重要分支,其目的就是在連續(xù)語音流中檢測(cè)是否存在某些感興趣的關(guān)鍵詞。
  在關(guān)鍵詞檢測(cè)的很多實(shí)際應(yīng)用中,輸入的信號(hào)是各種信道的自然對(duì)話語音數(shù)據(jù)。一般來說,由于聲學(xué)模型和語音數(shù)據(jù)的不匹配,關(guān)鍵詞檢測(cè)的性能會(huì)急劇地下降。為了解決這個(gè)問題,中科信利研發(fā)的關(guān)鍵詞檢測(cè)系統(tǒng)采用了一種基于混淆網(wǎng)絡(luò)的搜索策略。與以往不同的是,解碼是在整個(gè)聲學(xué)空間上進(jìn)行的,而不僅僅是關(guān)鍵詞所構(gòu)成的聲學(xué)空間,解碼器輸出不僅是首選結(jié)果,而是一種混淆網(wǎng)絡(luò)的數(shù)據(jù)結(jié)構(gòu)。通過統(tǒng)計(jì)訓(xùn)練數(shù)據(jù)中的發(fā)音變異情況,我們得到音素間的混淆度。利用這種音素間的混淆度和關(guān)鍵詞列表,我們就可以從解碼器輸出的混淆網(wǎng)絡(luò)中搜索獲取最有可能出現(xiàn)的關(guān)鍵詞。這種方法大大提高了關(guān)鍵詞的識(shí)別率,但同時(shí)也引入了一定的虛警。最后,我們采用了可靠的置信度策略來有效地降低了虛警。
  體系框架:
  功能模塊:
  語音識(shí)別模塊
  首先,輸入的實(shí)時(shí)語音流或語音文檔,經(jīng)過語音分段模塊處理后,產(chǎn)生分段信息和語音片斷;其次,各語音片斷經(jīng)連續(xù)語音識(shí)別引擎進(jìn)行識(shí)別產(chǎn)生網(wǎng)格結(jié)構(gòu);最后,網(wǎng)格結(jié)構(gòu)經(jīng)分解對(duì)齊后產(chǎn)生音節(jié)混淆網(wǎng)絡(luò)。
  索引模塊
  分段信息和音節(jié)混淆網(wǎng)絡(luò)通過前向索引產(chǎn)生前向索引文件。前向索引文件再經(jīng)逆向索引產(chǎn)生逆向索引文件。采用逆向索引的數(shù)據(jù)結(jié)構(gòu),是為了方便和減速后續(xù)的搜索過程。
  檢索模塊
  給定的關(guān)鍵詞首先通過字音轉(zhuǎn)換產(chǎn)生音節(jié)序列,再通過應(yīng)用音節(jié)混淆矩陣,采用中科信利在國際上首次提出的基于混淆網(wǎng)絡(luò)和模糊動(dòng)態(tài)規(guī)劃的關(guān)鍵詞檢索策略,在逆向索引文件中進(jìn)行快速模糊匹配,產(chǎn)生候選關(guān)鍵詞列表。
  技術(shù)特點(diǎn):
  • 關(guān)鍵詞檢測(cè)引擎與說話人無關(guān)。支持自然對(duì)話語音(如:電話聊天,廣播電視訪談等)。
  • 支持電話信道、廣播電視信道、互聯(lián)網(wǎng)信道等各類信道數(shù)據(jù)。
  • 關(guān)鍵詞列表可由用戶自主定義和修改。
  • 檢測(cè)結(jié)果不但包含關(guān)鍵詞在語音流或音頻文件中出現(xiàn)的位置,還包括相應(yīng)的置信度得分。
  • 操作點(diǎn)調(diào)整方便,可按不同的應(yīng)用需求調(diào)整操作點(diǎn)閾值,使系統(tǒng)性能根據(jù)應(yīng)用需求達(dá)到最優(yōu)。
  • 引擎處理速度快,核心算法支持海量并行處理。適應(yīng)于大規(guī)模語音數(shù)據(jù)的自動(dòng)檢測(cè)。
  • 引擎函數(shù)接口簡(jiǎn)單,用戶可以方便靈活地應(yīng)用開發(fā)。
  性能指標(biāo):
  應(yīng)用范圍:
  中科信利的關(guān)鍵詞檢測(cè)系統(tǒng),居于國內(nèi)領(lǐng)先、國際先進(jìn)水平。目前已在國內(nèi)電信、安全、廣電等多個(gè)行業(yè)領(lǐng)域中得到成功應(yīng)用。
  關(guān)鍵詞檢測(cè)的主要應(yīng)用領(lǐng)域大概有以下兩個(gè)方面:一是國家的信息安全領(lǐng)域。主要是用來對(duì)敏感語音信號(hào)的監(jiān)測(cè),一旦發(fā)現(xiàn)敏感關(guān)鍵詞可以立刻報(bào)警。二是多媒體檢索領(lǐng)域。采用關(guān)鍵詞檢測(cè)技術(shù),可以利用文字檢測(cè)出感興趣的音視頻流。

相關(guān)閱讀:

分享到: 收藏

最新新聞

紫金县| 孟津县| 湖南省| 宣城市| 易门县| 伊川县| 拉孜县| 汉中市| 青浦区| 济南市| 加查县| 介休市| 焦作市| 炉霍县| 武强县| 桓仁| 渭南市| 古交市| 罗城| 锦屏县| 安多县| 吕梁市| 内黄县| 井研县| 苏尼特左旗| 五原县| 綦江县| 湖北省| 博客| 台北县| 天门市| 全椒县| 乾安县| 丰顺县| 涟水县| 澄城县| 浠水县| 阳朔县| 尼玛县| 乌鲁木齐县| 安陆市|