語音識別演示及開發(fā)電路板
2002/11/28
1、簡介
RSC-300/364演示及開發(fā)用電路板是為美國Sensory公司的RSC-300/364語音識別芯片所專門設(shè)計的演示及開發(fā)用電路板,它可以用來演示Sensory的各種語音識別技術(shù),如SD(Speaker Dependent,特定人語音識別),SI(Speaker Independen,非特定人語音識別),SV(Speaker Verification,身份識別),RP(Record & Play,錄音回放)等等, 也可以用來做Sensory RSC-300/364語音識別芯片的簡易開發(fā)裝置。
2、演示程序說明
Speaker Dependent(SD)
SD 演示的是Sensory的需要說話人訓(xùn)練語音識別模板的語音識別技術(shù),它的特點(diǎn)是用戶需要先對所要識別的語音命令進(jìn)行訓(xùn)練,然后才能進(jìn)行語音識別。
本程序設(shè)定用戶可以依次訓(xùn)練32個命令, 命令無語言限制。SD有用FLASH SST 29EE020 作數(shù)據(jù)存儲器和用SEEPROM 24LC32作數(shù)據(jù)存儲器兩個版本,前者可以對所訓(xùn)練的語音命令進(jìn)行錄音,在語音識別時用來回放確認(rèn),后者無此功能
Speaker Independent(SI)
與SD相比,SI的最大特點(diǎn)是無需用戶訓(xùn)練,它的識別依賴于Sensory所事先已經(jīng)采集制作好了的語音模板,因此它的局限性較大,不僅是在語言上,還是在詞匯量上,都受到一定限制,但用戶使用方便。
本程序設(shè)置了六個語音命令:record,play,erase,call,modify,skip,用FLASH SST 29EE020 作數(shù)據(jù)存儲器。
Speaker Verification(SV)
SV的最大特點(diǎn)就是能夠識別用戶的身份,與SD相比,SV與SD都需要訓(xùn)練,不同的是在SD方式下,某個人訓(xùn)練的命令,在識別時由別人來說,只要兩人說得差不多,識別即可通過,而在SV方式下,某個人訓(xùn)練的命令,在識別時由別人來說,即使兩人說得差不多,也很難通過識別,因?yàn)镾V能夠識別用戶的身份,因此SV常被用在安全系統(tǒng)方面。
Record and Playback(RP)
RP主要是演示Sensory的錄音回放技術(shù),同時它也應(yīng)用了Sensory 的SI語音識別技術(shù)來選擇進(jìn)行錄音還是回放操作。RP錄音時間的長短依外接存儲器的大小而定,本程序用SST29EE020(2Mbits)作為數(shù)據(jù)存儲器,可以存儲大約16 秒的錄音。
深圳捷通公司供稿 CTI論壇編輯
相關(guān)鏈接:
捷通82語音識別模塊產(chǎn)品說明書
2003-06-09
語音合成芯片情況介紹和產(chǎn)品設(shè)想
2003-05-06
數(shù)字可視復(fù)讀機(jī)方案
2003-04-09
語音識別控制電話機(jī)方案
2003-04-04
智能早教機(jī)方案
2003-04-03
分類信息:
文摘
技術(shù)_語音識別_文摘