導(dǎo)讀: 論文給出一種基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)方案,該系統(tǒng)的硬件電路由嵌入式微處理器和音頻處理等主要芯片組成,采用Windows CE操作系統(tǒng),語(yǔ)音口令識(shí)別算法為連續(xù)隱馬爾可夫模型。語(yǔ)音口令識(shí)別技術(shù)可以通過(guò)嵌入式系統(tǒng)來(lái)實(shí)現(xiàn),并且應(yīng)用到許多需要使用口令控制的便攜式設(shè)備中。
隨著微電子技術(shù)的迅速發(fā)展,嵌入式系統(tǒng)在一些特定的專用設(shè)備上得到了廣泛應(yīng)用,通常這些設(shè)備的硬件資源(如處理器的運(yùn)行速度、存儲(chǔ)器的容量等)非常有限,并且對(duì)成本也有苛刻的要求,有時(shí)對(duì)實(shí)時(shí)響應(yīng)要求也比較高,在數(shù)字信號(hào)處理芯片上已經(jīng)實(shí)現(xiàn)了語(yǔ)音口令識(shí)別系統(tǒng)或語(yǔ)音口令識(shí)別系統(tǒng)的部分功能。語(yǔ)音口令識(shí)別技術(shù)與嵌入式系統(tǒng)的有效結(jié)合能夠顯示出其優(yōu)勢(shì)作用,但是也有很多有待進(jìn)一步提高和改進(jìn)之處,語(yǔ)音識(shí)別技術(shù)對(duì)運(yùn)算速度和內(nèi)存容量的要求都比較高,需要采用一些快速算法提高實(shí)時(shí)處理的性能。嵌入式微處理器的價(jià)格在不斷下降,但是其性能卻在不斷上升,嵌入式系統(tǒng)目前已經(jīng)廣泛地應(yīng)用于運(yùn)算量比較大的系統(tǒng)和設(shè)備中,而其體積小和低功耗的特點(diǎn)使其能夠發(fā)揮出更大的優(yōu)勢(shì)。
論文給出一種基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)的設(shè)計(jì)方案,硬件系統(tǒng)的核心芯片是嵌入式微處理器,語(yǔ)音口令識(shí)別算法采用連續(xù)隱馬爾可夫模型,現(xiàn)有的非特定人語(yǔ)音口令識(shí)別系統(tǒng)中,多采用狀態(tài)輸出具有連續(xù)概率分布的連續(xù)隱馬爾可夫模型CDHMM(Continuous DensityHidden Markov Model)[3]。操作系統(tǒng)則是采用的目前廣泛使用的Windows CE 5.0。
硬件電路的核心芯片是三星公司的嵌入式微處理器S3C2440AL,主頻為400MHz。該微處理器具有低功耗、高性能等特點(diǎn),廣泛應(yīng)用于便攜式設(shè)備中;谇度胧较到y(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng)需要有接收語(yǔ)音信號(hào)的輸入芯片配合麥克風(fēng)實(shí)現(xiàn)將模擬語(yǔ)音信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的功能,然后由嵌入式微處理器對(duì)輸入的語(yǔ)音口令信號(hào)進(jìn)行處理。完成語(yǔ)音口令信號(hào)輸入功能的芯片采用的是PHILIPS公司的低功耗芯片UDA1341TS。操作系統(tǒng)采用的是Windows CE5.0。Windows CE 5.0是一個(gè)32位操作系統(tǒng),具有模塊化、結(jié)構(gòu)化,能夠支持超過(guò)1000個(gè)公共Microsoft Win32應(yīng)用程序接口,并且與處理器無(wú)關(guān)等特點(diǎn),為各種嵌入式系統(tǒng)和產(chǎn)品設(shè)計(jì)提供了一種可裁剪的、高效的、可升級(jí)的操作系統(tǒng)。
1.系統(tǒng)設(shè)計(jì)
1.1 硬件電路的設(shè)計(jì)
論文給出的語(yǔ)音口令識(shí)別系統(tǒng)的硬件電路主要由嵌入式微處理器、存儲(chǔ)器和語(yǔ)音口令輸入芯片組成。核心芯片是嵌入式微處理器Samsung 32位S3C2440AL,其主頻為400MHz,最高頻率533MHz。64MB SDRAM,64MB的NAND FLASH存儲(chǔ)器,用來(lái)存儲(chǔ)操作系統(tǒng)文件等,2MB的NOR FLASH存儲(chǔ),為安裝BIOS使用。
S3C2440AL控制PHILIPS公司的UDA 1341TS完成輸入語(yǔ)音口令信號(hào)的功能。該音頻處理芯片由AD/DA轉(zhuǎn)換、控制邏輯電路、可編程增益放大器(PGA)和數(shù)字自動(dòng)增益控制器(AGC)以及數(shù)字信號(hào)處理器等部分組成,能進(jìn)行數(shù)字語(yǔ)音處理。
對(duì)于一個(gè)基于嵌入式系統(tǒng)的語(yǔ)音口令識(shí)別系統(tǒng),主要有以下幾個(gè)要求:
。1)完成語(yǔ)音口令識(shí)別功能時(shí),需要系統(tǒng)對(duì)人所發(fā)出的語(yǔ)音口令做出快速的響應(yīng),然后給出相應(yīng)的判斷結(jié)果。
。2)自動(dòng)獲得語(yǔ)音信號(hào)。語(yǔ)音口令識(shí)別系統(tǒng)一直處于隨時(shí)接受語(yǔ)音口令的工作狀態(tài),無(wú)需人工操作就能將人的語(yǔ)音命令與環(huán)境噪聲分離出來(lái),舍棄靜音信號(hào)和環(huán)境噪聲信號(hào)部分,僅僅對(duì)有效的語(yǔ)音口令信號(hào)做處理和識(shí)別。
。3)需要有足夠的存儲(chǔ)器容量存儲(chǔ)操作系統(tǒng)文件和訓(xùn)練好的語(yǔ)音口令模型庫(kù)以及存儲(chǔ)大量數(shù)據(jù)的數(shù)據(jù)緩沖區(qū)。
論文給出的語(yǔ)音口令識(shí)別系統(tǒng)選擇高性價(jià)比的嵌入式微處理器S3C2440AL和64MB隨機(jī)存儲(chǔ)器和64MB的閃存來(lái)滿足計(jì)算速度和數(shù)據(jù)緩存的要求。
1.2 軟件程序的設(shè)計(jì)
選擇Windows CE 5.0為語(yǔ)音口令識(shí)別系統(tǒng)的操作系統(tǒng),Windows CE 5.0是一個(gè)多任務(wù)操作系統(tǒng)。開(kāi)發(fā)工具主要有Platform. Builder 5.0和EVC++4.0。Platform. Builder5.0用于定制和開(kāi)發(fā)內(nèi)核,而EVC++4.0則用來(lái)編寫基于操作系統(tǒng)的應(yīng)用層程序,也就是算法執(zhí)行程序與圖形化界面,而圖形化的界面使用MFC編寫。
由于語(yǔ)音口令識(shí)別系統(tǒng)算法的運(yùn)算量比較大,所以為了能夠加快運(yùn)算速度,首先對(duì)Windows CE 5.0操作系統(tǒng)進(jìn)行配置,需要將相應(yīng)的板級(jí)支持包BSP(Board SupportPackage)導(dǎo)入到Platform. Builder 5.0,裁剪掉一些使用不到的資源,保留一些需要的資源,驅(qū)動(dòng)的配置正確后,將配置好的操作系統(tǒng)內(nèi)核裝入到嵌入式平臺(tái)中,然后進(jìn)行應(yīng)用程序的開(kāi)發(fā)。
語(yǔ)音口令識(shí)別系統(tǒng)分為訓(xùn)練和識(shí)別兩個(gè)過(guò)程。訓(xùn)練時(shí),語(yǔ)音口令信號(hào)首先經(jīng)過(guò)預(yù)處理,然后提取語(yǔ)音特征參數(shù),采用MFCC(Mel-Frequency Ceptral Coefficients)參數(shù)[4],然后建立此口令的連續(xù)隱馬爾可夫(CDHMM)模型,把所有經(jīng)過(guò)訓(xùn)練的語(yǔ)音口令的模型放在模型庫(kù)中。
在識(shí)別階段,與訓(xùn)練時(shí)提取語(yǔ)音口令信號(hào)的特征參數(shù)一樣,也要提取MFCC特征參數(shù),然后與保存在語(yǔ)音口令模型庫(kù)中的每一條語(yǔ)音口令模型相匹配,根據(jù)概率*分確定輸出識(shí)別結(jié)果。語(yǔ)音口令識(shí)別系統(tǒng)的程序流程圖如圖1所示。

共 2 頁(yè):1 2
OFweek電子工程網(wǎng)