聲紋識別的模式識別方法
2011/01/05
對于模式識別,有以下幾大類方法:
聲紋識別需要解決的關(guān)鍵問題還有很多,諸如:短話音問題,能否用很短的語音進行模型訓練,而且用很短的時間進行識別,這主要是聲音不易獲取的應用所需求的;聲音模仿(或放錄音)問題,要有效地區(qū)分開模仿聲音(錄音)和真正的聲音;多說話人情況下目標說話人的有效檢出;消除或減弱聲音變化(不同語言、內(nèi)容、方式、身體狀況、時間、年齡等)帶來的影響;消除信道差異和背景噪音帶來的影響;……此時需要用到其他一些技術(shù)來輔助完成,如去噪、自適應等技術(shù)。
對說話人確認,還面臨一個兩難選擇問題。通常,表征說話人確認系統(tǒng)性能的兩個重要參數(shù)是錯誤拒絕率和錯誤接受率,前者是拒絕真正說話人而造成的錯誤,后者是接受集外說話人而造成的錯誤,二者與閾值的設(shè)定相關(guān)。在現(xiàn)有的技術(shù)水平下,兩者無法同時達到最小,需要調(diào)整閾值來滿足不同應用的需求,比如在需要“易用性”的情況下,可以讓錯誤拒絕率低一些,此時錯誤接受率會增加,從而安全性降低;在對“安全性”要求高的情況下,可以讓錯誤接受率低一些,此時錯誤拒絕率會增加,從而易用性降低。前者可以概括為“寧錯勿漏”,而后者可以“寧漏勿錯”。我們把真正閾值的調(diào)整稱為“操作點”調(diào)整。好的系統(tǒng)應該允許對操作點的自由調(diào)整。
CTI論壇報道
聲紋識別技術(shù):利用人體生物特征進行身份認證 2011-01-05 |
聲紋識別的原理及其應用 2011-01-05 |
聲紋識別的分類 2011-01-05 |
聲紋識別的關(guān)鍵問題 2011-01-05 |
Nuance:車載信息平臺邁入語音時代 2010-12-27 |