首頁>>廠商>>CTI系統(tǒng)平臺(tái)廠商>>北京欣方

發(fā)表評(píng)論分享按鈕

語音識(shí)別技術(shù)在自動(dòng)外呼和洗號(hào)系統(tǒng)的應(yīng)用與優(yōu)勢(shì)

2011/07/18

摘要

  隨著呼叫中心系統(tǒng)呼出業(yè)務(wù)量的不斷增多,正確識(shí)別號(hào)碼狀態(tài),提高撥號(hào)效率已經(jīng)成為外呼型呼叫中心需要解決的重要問題。本文首先介紹了號(hào)碼識(shí)別在自動(dòng)外呼和洗號(hào)系統(tǒng)中的意義,接著分析了信令分析檢測(cè)方式的不足,進(jìn)而提出一種基于語音識(shí)別技術(shù)的外呼系統(tǒng),并闡述了語音識(shí)別技術(shù)在提高工作效率及降低成本上的優(yōu)勢(shì)及意義。

關(guān)鍵詞:呼叫中心;自動(dòng)外呼;洗號(hào);語音識(shí)別;

1.引言

  隨著呼叫中心市場(chǎng)的不斷成熟,呼入型業(yè)務(wù)基本飽和,通過電話由坐席主動(dòng)對(duì)客戶進(jìn)行拜訪和推銷產(chǎn)品的呼出型業(yè)務(wù)正逐步成為贏得客戶的關(guān)鍵手段。而如何對(duì)外呼號(hào)碼進(jìn)行準(zhǔn)確識(shí)別和篩選(“洗號(hào)”),以通過提高撥號(hào)效率來提升營(yíng)銷利潤(rùn),已經(jīng)成為迫在眉睫的問題。

  現(xiàn)有的自動(dòng)外呼及洗號(hào)系統(tǒng)中的號(hào)碼識(shí)別方法一般是通過信令處理等技術(shù)來實(shí)現(xiàn),而基于信令檢測(cè)的方式在準(zhǔn)確性和效率保證上又存在嚴(yán)重的問題。

  為了提高號(hào)碼識(shí)別的準(zhǔn)確性與效率,提出了一種基于語音識(shí)別技術(shù)的號(hào)碼識(shí)別方法,可應(yīng)用于自動(dòng)外呼和洗號(hào)系統(tǒng)。該方法通過與信令檢測(cè)方法相結(jié)合,可使自動(dòng)外呼和洗號(hào)系統(tǒng)中的語音識(shí)別準(zhǔn)確率達(dá)到95%以上;有效解決了傳統(tǒng)外呼和洗號(hào)系統(tǒng)中現(xiàn)存的弊端,很大程度上提高了撥號(hào)效率,從而達(dá)到了提高呼叫中心效益的目的。

2.自動(dòng)外呼和洗號(hào)系統(tǒng)

  自動(dòng)外呼系統(tǒng)是一個(gè)自動(dòng)執(zhí)行企業(yè)用戶定制的外呼任務(wù)的系統(tǒng)。它執(zhí)行的特點(diǎn)是系統(tǒng)根據(jù)座席狀態(tài)和算法策略對(duì)指定號(hào)碼集自動(dòng)發(fā)起呼叫,通過分析呼叫過程中的信令和信號(hào),對(duì)呼叫采取合適的處理。具體處理方法為:當(dāng)呼叫接通時(shí),系統(tǒng)將呼叫轉(zhuǎn)接給座席;若用戶未接通,則繼續(xù)呼叫下一個(gè)號(hào)碼,同時(shí)代替座席記錄當(dāng)前呼叫的狀態(tài)。

  洗號(hào)系統(tǒng)也是自動(dòng)外呼系統(tǒng)的一個(gè)重要應(yīng)用,其原理是系統(tǒng)提前將雜亂的號(hào)碼試呼一遍,清除一些無效號(hào)碼,如空號(hào)、停機(jī)、欠費(fèi)、格式錯(cuò)誤等,以此來提高外呼效率。

  值得注意的是,自動(dòng)外呼和洗號(hào)系統(tǒng)都需要通過號(hào)碼識(shí)別來確定所呼號(hào)碼的狀態(tài),系統(tǒng)的效率很大程度上取決于其對(duì)號(hào)碼的識(shí)別能力。然而,目前常見的號(hào)碼狀態(tài)分為多種類型:
  1. 號(hào)碼不可用(空號(hào),停機(jī),欠費(fèi),地址不全等);

  2. 暫時(shí)不可用(關(guān)機(jī),不在服務(wù)中,通話中等);

  3. 可用(無應(yīng)答,被叫忙等)、自動(dòng)應(yīng)答號(hào)碼(傳真、企業(yè)總機(jī)等)。
  由于三大運(yùn)商營(yíng)對(duì)如此繁多的號(hào)碼狀態(tài)未作統(tǒng)一標(biāo)準(zhǔn),加上信令檢測(cè)方式存在很多弊端,使得對(duì)號(hào)碼的識(shí)別具有相當(dāng)大的挑戰(zhàn)。首先,錯(cuò)誤的識(shí)別會(huì)導(dǎo)致部分?jǐn)?shù)據(jù)的丟失,使企業(yè)失去一些潛在用戶,直接導(dǎo)致利益損失。其次,識(shí)別速度過慢,不但影響系統(tǒng)的整體效率,還會(huì)影響座席人員的工作熱情,這也成為了提高企業(yè)利潤(rùn)的瓶頸。因此,如何對(duì)號(hào)碼進(jìn)行正確、高效的識(shí)別是當(dāng)前要解決的關(guān)鍵問題,這也使得對(duì)號(hào)碼識(shí)別方式的研究具有了現(xiàn)實(shí)意義。

3.號(hào)碼識(shí)別方式分析

  在實(shí)際網(wǎng)絡(luò)中,表示被叫用戶狀態(tài)有三種方式:標(biāo)準(zhǔn)Tone音、提示音和7號(hào)信令。每種方式又可細(xì)分為多種表現(xiàn)形式:

  標(biāo)準(zhǔn)的Tone音:振鈴音,忙音,空號(hào),不可達(dá)音等,這種方式在固定網(wǎng)中比較常見。

  提示音:“該號(hào)碼不存在”,“該號(hào)碼是空號(hào)”,“該號(hào)碼已停機(jī)”等。通過提示音來顯示當(dāng)前被叫用戶狀態(tài)多發(fā)生在移動(dòng)網(wǎng)絡(luò)中。

  7號(hào)信令。在呼叫釋放的信令(releasecall),會(huì)帶釋放原因:“Unallocated Num”“user busy”等,也常被移動(dòng)網(wǎng)絡(luò)采用。

  目前自動(dòng)外呼和洗號(hào)系統(tǒng)主要采用信令分析、語音識(shí)別技術(shù)(包括檢測(cè)音頻)等進(jìn)行號(hào)碼識(shí)別和篩選。下面將對(duì)幾種檢測(cè)方式進(jìn)行詳細(xì)說明。

  3.1 信令檢測(cè)方式分析

  一般情況下,號(hào)碼識(shí)別需根據(jù)當(dāng)前呼叫失敗的原因來判斷,因此,通常會(huì)利用呼叫過程中產(chǎn)生的信令來檢測(cè)。然而這種檢測(cè)方式存在嚴(yán)重的準(zhǔn)確性和效率問題,不能滿足呼叫中心自動(dòng)外呼和洗號(hào)的功能要求。

  首先,采用這種方式進(jìn)行檢測(cè)準(zhǔn)確性差。其原因是:在中國(guó)三大運(yùn)營(yíng)商現(xiàn)網(wǎng)中,反映被叫用戶的狀態(tài)沒有統(tǒng)一的標(biāo)準(zhǔn)。甚至同一個(gè)運(yùn)營(yíng)商的同一個(gè)本地網(wǎng)都會(huì)出現(xiàn)不相同的情況。標(biāo)準(zhǔn)的不統(tǒng)一,為信令的檢測(cè)造成了困難,經(jīng)常出現(xiàn)號(hào)碼狀態(tài)無法識(shí)別、錯(cuò)誤識(shí)別的情況。

  其次,采用信令檢測(cè)方式效率低下,由于PSTN普遍實(shí)施了呼叫失敗后語音提示的人性化功能,語音提示時(shí)長(zhǎng)可達(dá)60秒,然后才發(fā)送信令。這樣嚴(yán)重影響了信令檢測(cè)的效率。

  下例為對(duì)河北移動(dòng)某呼叫中心自動(dòng)外呼系統(tǒng)的信令測(cè)試結(jié)果分析(該系統(tǒng)使用的交換機(jī)為Dialogic IMG1010網(wǎng)關(guān),信令方式為ISUP):

  表1:信令號(hào)碼識(shí)別測(cè)試


  從歸納的情況看,只有無應(yīng)答和地址不全兩種情況是可靠信令分析來識(shí)別的,其他的5種情況都無法通過信令檢測(cè)識(shí)別。特別是暫時(shí)無法接通的語言提示,播放完提示音有3種不同的信令,應(yīng)該是屬于不同的情況,但是放了相同的語音。因此造成號(hào)碼識(shí)別錯(cuò)誤的現(xiàn)象。

  綜上,信令分析檢測(cè)方式,對(duì)于釋放7號(hào)信令來表示用戶狀態(tài)的情況是十分有效的。但是,該方式不具備區(qū)分標(biāo)準(zhǔn)Tone音和提示音的能力,同時(shí)效率低下。要準(zhǔn)確、高效的判斷用戶的當(dāng)前狀態(tài),必須要通過一種更為準(zhǔn)確可靠的方式——語音識(shí)別。

  3.2 語音識(shí)別檢測(cè)方式分析

  現(xiàn)有PSTN網(wǎng)絡(luò)普遍實(shí)施了呼叫失敗后語音提示或tone音的人性化功能,由于這些tone音和失敗提示音都是在臨時(shí)話路中播放的,因此信令的方式無法區(qū)分這兩種場(chǎng)景。但是語音識(shí)別技術(shù)恰恰是利用了這個(gè)特點(diǎn),對(duì)語音提示或tone音進(jìn)行快速的語音識(shí)別與匹配,在精確識(shí)別號(hào)碼的同時(shí),提升了識(shí)別的速率。

  首先,采用語音識(shí)別技術(shù)可幫助自動(dòng)外呼和洗號(hào)系統(tǒng)提高號(hào)碼識(shí)別的準(zhǔn)確率。系統(tǒng)通過語音匹配將相同信令的呼叫區(qū)分,幫助洗號(hào)系統(tǒng)正確的識(shí)別可用號(hào)碼,同時(shí)還能幫助自動(dòng)外呼系統(tǒng)正確的記錄座席呼叫狀態(tài),避免了因錯(cuò)誤識(shí)別而導(dǎo)致數(shù)據(jù)丟失的情況發(fā)生。

  其次,語音識(shí)別技術(shù)還可以幫助自動(dòng)外呼和洗號(hào)系統(tǒng)實(shí)現(xiàn)高效識(shí)別。系統(tǒng)通過特征和關(guān)鍵字匹配的方式,在幾秒鐘內(nèi)就能完成語音匹配,幫助自動(dòng)外呼系統(tǒng)真正的提高了座席工作效率;同樣也幫助洗號(hào)系統(tǒng)提高了效率,使其以更少的設(shè)備投入獲得更好的效益。

  綜上,采用語音識(shí)別技術(shù),進(jìn)行模式匹配,可以精確、高效的識(shí)別號(hào)碼狀態(tài),彌補(bǔ)了信令檢測(cè)方式的不足。但是語音識(shí)別技術(shù)也存在一些難點(diǎn),例如,樣本庫的建立、方言識(shí)別以及提高識(shí)別效率等等。這些技術(shù)難點(diǎn)也成為了語音識(shí)別檢測(cè)方式需要解決的重要問題。

4.語音識(shí)別技術(shù)的應(yīng)用

  4.1 基本原理

  語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。它可用于對(duì)用戶呼叫失敗的情況進(jìn)行自動(dòng)分類。

  我們采用的語音識(shí)別技術(shù)主要靠匹配方式來進(jìn)行,分成Tone音匹配、AM音匹配和人類自然語音檢測(cè)三部分。具體流程圖如下:

語音處理流程圖

圖:語音處理流程圖

(VAD: Voice Activity Detection;LV: Live Speech;AM: Answering Machine)

  圖中,Tone音匹配采用模式匹配方法,可以實(shí)現(xiàn)對(duì)振鈴音,忙音,空號(hào),不可達(dá)音等100多種標(biāo)準(zhǔn)提示音的識(shí)別。AM(Answering Machine)音匹配主要負(fù)責(zé)識(shí)別傳真機(jī)、自動(dòng)答錄機(jī)等機(jī)器語音,同樣采用模式匹配方法,將收到的語音與標(biāo)準(zhǔn)樣本庫進(jìn)行比對(duì)。人類自然語音檢測(cè)的功能主要通過人真實(shí)聲音的檢測(cè),來判斷是否需要進(jìn)行語音匹配。

  4.1.1 標(biāo)準(zhǔn)Tone音匹配

  Tone音匹配采用的是模式匹配方法,將模擬語音信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),再同音庫中的樣本進(jìn)行比對(duì),實(shí)現(xiàn)號(hào)碼狀態(tài)識(shí)別。

  在標(biāo)準(zhǔn)Tone音匹配模塊里,因?yàn)槟承﹩晤lTone音的頻率區(qū)間和DTMF之間存在重疊,為了避免不必要的混淆,采取順序檢測(cè),即首先檢測(cè)是否是DTMF,再檢測(cè)是否是單頻的Tone音。

  Tone音的一個(gè)顯要特點(diǎn)是在頻域上的某一個(gè)子帶上的能量特別強(qiáng),而且這種情況是在后續(xù)所有非靜音的連續(xù)幀上都是持續(xù)的(如圖1所示);诖颂攸c(diǎn),我們采用以下方法:

  1.取第一幀非靜音幀的16個(gè)子帶能量特征,求出其最大子帶能量所在的子帶序號(hào)(在DTMF階段是取最大的兩個(gè)子帶序號(hào))。
  2.如果最大能量值所在的子帶序號(hào)一直保持若干幀不變,則我們認(rèn)為從頻率角度滿足了作為一個(gè)Tone音的基本條件。

  由于DTMF不存在時(shí)間持續(xù)長(zhǎng)短的相關(guān)信息,所以經(jīng)過上述步驟后,只需將最大能量的兩個(gè)序號(hào)在事先準(zhǔn)備好的DTMF子帶序號(hào)表里查找即可得出結(jié)論,對(duì)于檢測(cè)DTMF顯然已經(jīng)足夠。但由于單頻的Tone音還存在持續(xù)時(shí)間長(zhǎng)短及靜音間歇的問題,故對(duì)于輸入的信號(hào),經(jīng)過前端數(shù)據(jù)處理過程之后,要利用它是否靜音幀的信息統(tǒng)計(jì)各段長(zhǎng)度,最后,同時(shí)考慮頻率和時(shí)間段列表,如果滿足庫中某一條的相關(guān)標(biāo)準(zhǔn),才認(rèn)為是一個(gè)標(biāo)準(zhǔn)Tone音。

  4.1.2 AM音匹配

  AM音匹配同樣采用模式匹配方法,對(duì)語音信號(hào)進(jìn)行采樣、量化、歸一化處理后,將模擬語音信號(hào)轉(zhuǎn)變?yōu)閿?shù)字語音信號(hào)。再與庫文件中的特征模板進(jìn)行比較,選擇出最為相近的一條作為匹配結(jié)果返回。

  假設(shè)模板庫里的特征條目的時(shí)長(zhǎng)應(yīng)該至少是一個(gè)完整的AM音模板,因此從時(shí)間長(zhǎng)度上來看,輸入的待檢測(cè)語音長(zhǎng)度應(yīng)小于模板里的最佳匹配項(xiàng)。

  不像Tone音檢測(cè)模塊中使用的是各幀在前端處理過程中產(chǎn)生的16個(gè)子帶上的能量具體值,這里使用的特征卻是經(jīng)過歸一化后的二進(jìn)制向量。如果要比較的兩幀特征向量分別設(shè)為:


  其中, 指異或操作,而函數(shù) 是求二進(jìn)制向量里“1”的個(gè)數(shù)。

  然后,如果輸入語音樣本的幀數(shù)目為 ,則總距離定義為相應(yīng)的 幀距離的和。

  至于要得到這條語音樣本與特征庫里某個(gè)模板的最小距離,比較傳統(tǒng)的方法是用這待匹配的 幀同模板的開始處 幀算距離,然后將待匹配音順次后移,一直到末端為止,得到的最小距離就是這個(gè)輸入樣本同這一模板的距離。然后,在實(shí)際實(shí)現(xiàn)過程中,因?yàn)閷?duì)算法性能要求比較高,可以考慮加入不同的索引而達(dá)到減小計(jì)算次數(shù)的目的。索引的種類和方法不一而足,在此就不再贅述了。

  4.1.3 自然語音(Live Speech)檢測(cè)

  該部分的主要功能是利用人類自然語音特有的一些規(guī)律進(jìn)行啟發(fā)式判斷,從而確定是否需要進(jìn)入Tone音或AM音識(shí)別流程。該部分采用的規(guī)律如下:

  A.如果正式語音之前的靜音段超過某一閾值,則認(rèn)為是人類自然語音
  B.如果問候語過長(zhǎng),時(shí)間上超過某一閾值,則認(rèn)為是應(yīng)答機(jī)錄音。
  C.如果問候語之后的靜音段過長(zhǎng)以至于超過某個(gè)門限,則認(rèn)為是人類自然語音。
  D.如果問候語中的詞語數(shù)目過多,則認(rèn)為是應(yīng)答機(jī)錄音。

  除此之外,我們還設(shè)定了一個(gè)檢測(cè)最大時(shí)間,如果超過這一時(shí)間還沒有一個(gè)檢測(cè)結(jié)果,則返回一個(gè)“無法判斷”的結(jié)果。

  最后,相關(guān)參數(shù)、時(shí)間以及判斷結(jié)果的關(guān)系如圖所示:

人類自然語音情況下各參數(shù)相對(duì)于時(shí)間軸的說明

圖:人類自然語音情況下各參數(shù)相對(duì)于時(shí)間軸的說明

自動(dòng)應(yīng)答機(jī)錄音情況下各參數(shù)相對(duì)于時(shí)間軸的說明

圖:自動(dòng)應(yīng)答機(jī)錄音情況下各參數(shù)相對(duì)于時(shí)間軸的說明

5.產(chǎn)品與應(yīng)用

  根據(jù)以上語音識(shí)別的方法,設(shè)計(jì)了基于語音識(shí)別技術(shù)的自動(dòng)外呼和洗號(hào)系統(tǒng)。以下部分將對(duì)該產(chǎn)品的框架及模塊進(jìn)行介紹。

  5.1 技術(shù)架構(gòu)

系統(tǒng)技術(shù)架構(gòu)

圖:系統(tǒng)技術(shù)架構(gòu)

  上圖為基于語音識(shí)別的自動(dòng)外呼和洗號(hào)系統(tǒng)的技術(shù)架構(gòu),由接入部分和平臺(tái)部分組成。其中終端為接入部分,提供包括PSTN傳統(tǒng)交換機(jī)、NGN軟交換和內(nèi)部分機(jī)終端等多種網(wǎng)絡(luò)和終端的接入能力。平臺(tái)部分由ACD、CTI和MS等節(jié)點(diǎn)組成,提供呼叫中心語音接入、控制、管理和路由等功能。

  ACD是呼叫中心的核心控制系統(tǒng),主要負(fù)責(zé)呼叫中心信令、呼叫與控制節(jié)點(diǎn),負(fù)責(zé)信令識(shí)別。支持呼叫中心業(yè)務(wù)觸發(fā)到CTI。

  CTI提供座席資源管理和排隊(duì)、路由策略,支持座席接入,同時(shí)支持MS的訪問。

  MS(Media Server,媒體服務(wù)器)是NGN架構(gòu)中提供所有媒體資源的設(shè)備,是呼叫中心媒體匯聚與統(tǒng)一處理點(diǎn),所有的媒體資源處理都有MS來完成,包括IVR、DTMF、會(huì)議、錄音、傳真等。在媒體服務(wù)器上加入語音識(shí)別模塊,對(duì)收到的RTP語音流進(jìn)行實(shí)時(shí)的匹配和識(shí)別。

  MS中新增加的語音識(shí)別模塊,由前端語音數(shù)據(jù)處理模塊、數(shù)據(jù)管理模塊、標(biāo)準(zhǔn)Tone音匹配模塊、人類自然語音檢測(cè)模塊、AM音匹配模塊五部分組成,共同完成語音識(shí)別檢測(cè)。其模塊組成如下:

語音識(shí)別的模塊組成

圖:語音識(shí)別的模塊組成

  前端語音數(shù)據(jù)處理模塊,用來對(duì)語音進(jìn)行預(yù)處理和特征提取。數(shù)據(jù)管理模塊,主要工作為建庫。標(biāo)準(zhǔn)Tone音匹配模塊,匹配標(biāo)準(zhǔn)Tone音。人類自然語音(Live Speech)檢測(cè)模塊,進(jìn)行人類真實(shí)接聽語音的判斷。AM音匹配模塊,從庫中匹配合適的模板音和判斷是否為庫外音。

  該模塊負(fù)責(zé)進(jìn)行語音識(shí)別的第一步:預(yù)處理和特征提取。該模塊在模塊處理中的地位非常重要,對(duì)于數(shù)據(jù)管理模塊來說,AM庫文件的每一條內(nèi)容是經(jīng)過前段語音數(shù)據(jù)處理以后的特征;而后面的三個(gè)檢測(cè)或匹配模塊都是建立在前端數(shù)據(jù)處理以后的數(shù)據(jù)基礎(chǔ)之上的。因此,前端語音數(shù)據(jù)處理的方法和所選用的特征對(duì)于檢測(cè)或匹配的準(zhǔn)確率和算法的效率都至關(guān)重要。

  本模塊的核心工作是對(duì)給定的Tone音標(biāo)準(zhǔn)和AM模板音庫進(jìn)行分析和特征提取,并存成相應(yīng)的特征庫文件。特征庫主要分為Tone庫和AM庫,其建立過程如下:

  A.Tone庫

  Tone庫的建立過程比較簡(jiǎn)單。因?yàn)橛屑榷ǖ臉?biāo)準(zhǔn),不需要從模板文件中讀取再生成。所以,采用的方法是直接從記錄有標(biāo)準(zhǔn)Tone音標(biāo)準(zhǔn)的文本文件中逐條逐項(xiàng)讀取,然后依樣存成二進(jìn)制庫文件Tone.dat。

  B.AM庫

  AM庫的建立過程比Tone音庫稍微復(fù)雜一些,原因是要經(jīng)過從相應(yīng)的pcm文件模板進(jìn)行分析和提取特征的過程,因此就多了一個(gè)前端語音數(shù)據(jù)處理模塊。存入庫中的信息包括模板ID號(hào)、是否靜音幀、模板幀數(shù)目、FFT特征序列以及歸一化后的特征序列。歸一化前的特征序列會(huì)用于tone音檢測(cè)模塊,而歸一化后的特征序列用于AM匹配。

  該模塊的功能是進(jìn)行標(biāo)準(zhǔn)Tone音匹配。該系統(tǒng)采取的是順序檢測(cè),即首先檢測(cè)是否是DTMF,再檢測(cè)是否是單頻的Tone音。

  該模塊負(fù)責(zé)判斷人類真實(shí)語音。人類自然語音檢測(cè)在三個(gè)檢測(cè)或匹配模塊中是最難處理的一塊。因?yàn)楸举|(zhì)上說,自動(dòng)應(yīng)答機(jī)的話音也是人通過錄音機(jī)事先錄好的,所以從聲學(xué)層次并不能有效地將它們區(qū)分開。該系統(tǒng)利用人類自然語音特有的一些規(guī)律進(jìn)行啟發(fā)式判斷,來進(jìn)行人類語音的識(shí)別。

  AM音匹配模塊的主要任務(wù)是將輸入的語音經(jīng)過處理后,與庫文件中的特征模板進(jìn)行比較,選擇出最為相近的一條作為匹配結(jié)果返回。若經(jīng)過與所有的特征模板都進(jìn)行比較后得出的最小距離仍然大于某一個(gè)門限值,則認(rèn)為輸入語音是庫外音。

  同時(shí),該系統(tǒng)還通過提取各地不同網(wǎng)絡(luò)、運(yùn)營(yíng)商的提示音庫,建立了一個(gè)龐大的樣本庫。目前該系統(tǒng)已擁有三大運(yùn)營(yíng)商、30多個(gè)省市的近300個(gè)樣本庫,可根據(jù)項(xiàng)目需要靈活加載部署,從而解決了方言識(shí)別的問題。

  5.2 平臺(tái)架構(gòu)

  基于語音識(shí)別技術(shù)的自動(dòng)外呼和洗號(hào)系統(tǒng)主要由管理應(yīng)用、外呼與庫模塊、號(hào)碼與識(shí)別模塊三部分組成。每部分的功能如下:

系統(tǒng)組成

圖:系統(tǒng)組成

  5.2.1 管理應(yīng)用

  該部分由任務(wù)管理、號(hào)碼管理、提示音管理、自學(xué)系統(tǒng)四部分組成,任務(wù)管理負(fù)責(zé)創(chuàng)建洗號(hào)任務(wù),選擇號(hào)碼庫,設(shè)置時(shí)間速率等。號(hào)碼管理可以實(shí)現(xiàn)包括號(hào)碼導(dǎo)入導(dǎo)出,未洗號(hào)碼、已洗號(hào)碼分類檢查,重聽錄音等功能。提示音導(dǎo)入導(dǎo)出,試聽檢測(cè)靠提示音管理來進(jìn)行。自學(xué)習(xí)系統(tǒng)能對(duì)不能識(shí)別號(hào)碼進(jìn)行人工干預(yù)和二次識(shí)別,將提示音加入庫,從而保證了提示音樣本庫的不斷增長(zhǎng)。

  5.2.2 外呼與庫模塊

  該部分由自動(dòng)外呼模塊、號(hào)碼庫、錄音庫、提示音庫四部分組成。自動(dòng)外呼模塊:按指定速率進(jìn)行外呼,并將呼叫結(jié)果保存入庫。號(hào)碼庫用來保存各種號(hào)碼資源,特別是有效號(hào)碼,包括移動(dòng)號(hào)碼(聯(lián)通、移動(dòng)、電信),固定號(hào)碼(電信、聯(lián)通)。提示音庫樣本庫覆蓋了各地、運(yùn)營(yíng)商及網(wǎng)絡(luò)。錄音庫可對(duì)洗號(hào)結(jié)果進(jìn)行錄音,還可用于人工抽查,并且可進(jìn)行二次分析和自學(xué)習(xí),提供增值能力。

  5.2.3 呼叫與號(hào)碼識(shí)別模塊

  該部分由CTI、ACD、MS三部分組成,也是系統(tǒng)的主要組成部分。CTI負(fù)責(zé)指示ACD發(fā)起外呼,上報(bào)結(jié)果。ACD控制信令檢測(cè),而MS負(fù)責(zé)提供語音導(dǎo)航和自動(dòng)服務(wù)功能,可解析執(zhí)行來實(shí)現(xiàn)語音交互能力,是完成語音識(shí)別的主要部分。

  5.3 基于語音識(shí)別的號(hào)碼識(shí)別流程

  下圖為該產(chǎn)品基于語音識(shí)別的號(hào)碼識(shí)別流程,具體洗號(hào)流程如下圖:

基于語音識(shí)別的洗號(hào)流程

圖:基于語音識(shí)別的洗號(hào)流程

  洗號(hào)流程發(fā)生在呼叫建立過程中,如果存在臨時(shí)話路(彩鈴、tone音、各種識(shí)別提示音等情況),則進(jìn)入到語音識(shí)別過程。具體:

  1. 系統(tǒng)發(fā)起呼叫,根據(jù)返回的信令確定下一步處理流程

  2. 如果是200響應(yīng)碼,表明呼叫接通,直接轉(zhuǎn)到座席處理

  3. 如果是3XX-6XX響應(yīng)碼,表明呼叫失敗,根據(jù)信令響應(yīng)碼和Reason原因值進(jìn)行檢測(cè)

  4. 如果是18X響應(yīng)碼,表明在振鈴階段,需要根據(jù)是否帶SDP確定下一步處理

  5. 如果18X帶了SDP,表明進(jìn)入了臨時(shí)話路,那么連接語音識(shí)別模塊進(jìn)行匹配處理

  6. 如果18X沒有帶SDP,則表明只是普通的振鈴,無需識(shí)別
  5.4 系統(tǒng)特點(diǎn)

  語音識(shí)別技術(shù)應(yīng)用于號(hào)碼識(shí)別領(lǐng)域,對(duì)呼叫建立過程中臨時(shí)話路播放的語音進(jìn)行快速匹配,以實(shí)現(xiàn)號(hào)碼快速和精確的識(shí)別具有非凡的意義;谝陨险Z音識(shí)別模塊的洗號(hào)系統(tǒng),相比單靠信令檢測(cè)的洗號(hào)系統(tǒng),更高效可靠。其特點(diǎn)如下:   從技術(shù)方面來看,欣方公司的洗號(hào)系統(tǒng)目前面向PSTN(固定電話網(wǎng))、PLMN(移動(dòng)電話網(wǎng))和NGN(軟交換)網(wǎng)絡(luò),能夠支持音頻(Tone音)檢測(cè)、信令(ISDN PRI、七號(hào)信令等)處理、語音識(shí)別等洗號(hào)產(chǎn)品關(guān)鍵技術(shù),號(hào)碼篩選準(zhǔn)確率在95%以上,是國(guó)內(nèi)洗號(hào)系統(tǒng)中有效號(hào)碼識(shí)別率最高的產(chǎn)品之一。   在固網(wǎng)中,交換機(jī)使用Tone標(biāo)識(shí)被叫用戶狀態(tài)的比較多,如正;剽徱、忙音等,欣方洗號(hào)系統(tǒng)針對(duì)Tone音的檢測(cè)能夠達(dá)到100%的準(zhǔn)確率。   在標(biāo)準(zhǔn)的信令處理方面,被叫的交換機(jī)會(huì)主動(dòng)釋放呼叫(Release),并在信令中包含釋放原因,如“Unallocated Num”(空號(hào))、“User Busy”(被叫忙)等。欣方洗號(hào)系統(tǒng)在信令處理方面能夠達(dá)到100%的準(zhǔn)確率。   這是欣方洗號(hào)系統(tǒng)中最具難度、同時(shí)也是最具技術(shù)含量的部分。由于國(guó)內(nèi)三大電信運(yùn)營(yíng)商在語音提示反映被叫狀態(tài)方面,沒有統(tǒng)一的標(biāo)準(zhǔn)。例如,同樣是被叫為空號(hào)的提示音,可能是“對(duì)不起,您撥的號(hào)碼是空號(hào)”,也可能是“對(duì)不起,您撥的號(hào)碼不存在”等等。為此,欣方洗號(hào)系統(tǒng)配置了一個(gè)可擴(kuò)展的音庫,將各種提示音以及其具體的含義定義在里面。目前音庫中包含固網(wǎng)提示音600多條,移動(dòng)提示音100多條,基本上覆蓋了三大運(yùn)營(yíng)商全國(guó)各省的網(wǎng)絡(luò)提示音。   由于國(guó)內(nèi)三大電信運(yùn)營(yíng)商(特別是固網(wǎng)運(yùn)營(yíng)商)存在太多的不同品牌交換機(jī),并且各個(gè)本地網(wǎng)的提示音經(jīng)常不相同(有時(shí)候即使提示內(nèi)容相同,但是提示音的音調(diào)、語氣也可能不同),這就對(duì)洗號(hào)系統(tǒng)的語音識(shí)別能力提出了更高的要求。欣方洗號(hào)系統(tǒng)對(duì)外呼采用會(huì)議方式進(jìn)行全程錄音,會(huì)議方式錄音保證了錄音的可靠性。用戶通過對(duì)錯(cuò)誤檢測(cè)錄音的分析,可以生成新的語音識(shí)別樣本庫,動(dòng)態(tài)加載到系統(tǒng)中。從而進(jìn)一步提高識(shí)別精準(zhǔn)度。這種自學(xué)習(xí)的語音識(shí)別功能,保證了欣方洗號(hào)系統(tǒng)所具備的高識(shí)別率。
  欣方洗號(hào)系統(tǒng)中單個(gè)呼叫在5秒內(nèi)完成語音檢測(cè),并結(jié)束呼叫。單個(gè)E1的配置情況下,每小時(shí)可以實(shí)現(xiàn)并發(fā)外呼8000個(gè)號(hào)碼。   欣方洗號(hào)系統(tǒng)軟件采用C++語言開發(fā),運(yùn)行于Linux環(huán)境下。由于使用的是呼叫中心、智能網(wǎng)平臺(tái)同一套底層代碼,因此系統(tǒng)穩(wěn)定性非常高,是電信級(jí)的產(chǎn)品。同時(shí),硬件成本低,根據(jù)用戶成本,可以分別配置工控機(jī)+板卡或PC服務(wù)器+語音網(wǎng)關(guān)的方式。同時(shí)該平臺(tái)具有良好的擴(kuò)展性,單臺(tái)機(jī)器可支持最少1E1,最大64E1的ISDN PRI或ISUP接入。

  具有重呼機(jī)制:

  對(duì)于語音識(shí)別出的用戶失敗的情況,例如用戶忙、無應(yīng)答、不在服務(wù)區(qū)等情況,系統(tǒng)可設(shè)置重呼策略,包括重呼時(shí)間和重呼次數(shù)的設(shè)置。例如設(shè)置在10分鐘后重呼、重呼次數(shù)為2次,則在第1次呼叫失敗完畢后的10分鐘后進(jìn)行第1次重呼,若第1次重呼時(shí)還是無應(yīng)答等情況,將在接下來的10分鐘后進(jìn)行第二次重呼。

6.測(cè)試結(jié)果

  通過撥打固定電話、手機(jī)、軟電話、傳真機(jī)等通信終端,對(duì)語音識(shí)別部分每個(gè)模塊的準(zhǔn)確性、時(shí)效性、并發(fā)性和穩(wěn)定性進(jìn)行了測(cè)試,結(jié)果如下表:

  表2 語音匹配系統(tǒng)系統(tǒng)功能表


  從測(cè)試結(jié)果可以看出,該系統(tǒng)能與各種可能的回傳語音進(jìn)行匹配,實(shí)現(xiàn)準(zhǔn)確、高效的語音檢測(cè)分類功能。

7.成功案例

  欣方綜合信令識(shí)別和語音識(shí)別技術(shù),為自動(dòng)外呼和洗號(hào)系統(tǒng)提供了完善的技術(shù)方案,典型案例如下: 8.結(jié)束語

  本文提出了一種基于語音識(shí)別的檢測(cè)方法,該方法采用模式匹配對(duì)tone音、AM音進(jìn)行快速匹配,可以準(zhǔn)確地識(shí)別號(hào)碼狀態(tài),很好的彌補(bǔ)了信令檢測(cè)方式的不足,很大程度上提高了號(hào)碼識(shí)別的準(zhǔn)確率與效率。

  目前,基于語音識(shí)別的檢測(cè)方法已經(jīng)產(chǎn)品化,并成功的應(yīng)用到河北移動(dòng)卓望和信元博雅固話洗號(hào)平臺(tái)上。經(jīng)過測(cè)試,該系統(tǒng)具有良好的并發(fā)性與穩(wěn)定性,同時(shí)通過對(duì)號(hào)碼的有效甄別和篩選,顯著減少了座席等待時(shí)長(zhǎng),顯著減少了座席等待時(shí)長(zhǎng),提高了撥號(hào)效率,進(jìn)而降低了外呼成本。

  隨著呼叫中心市場(chǎng)的成熟,基于語音識(shí)別檢測(cè)方法會(huì)對(duì)提高呼叫中心的效率、增加企業(yè)利潤(rùn)具有重要意義,其應(yīng)用前景將十分廣闊。但是在號(hào)碼識(shí)別領(lǐng)域,仍有許多值得研究的問題。例如,隨著樣本庫的擴(kuò)增,號(hào)碼識(shí)別的準(zhǔn)確度和效率也會(huì)隨之下降,因此采用區(qū)別于模式匹配的ASR語音識(shí)別方法來進(jìn)行號(hào)碼識(shí)別,將是我們研究的下一個(gè)重點(diǎn)。
共 4 頁:1 2 3 4 

作者供稿 CTI論壇編輯



相關(guān)閱讀:
北京欣方承建河北博岳外呼呼叫中心系統(tǒng) 2011-07-15
案例:河南農(nóng)信部署ITSM服務(wù)平臺(tái) 2011-06-10
欣方中繼網(wǎng)關(guān)CIN-MG 2011-05-10
欣方外包呼叫中心及電銷企業(yè)洗號(hào)系統(tǒng)方案 2011-05-09
欣方多媒體呼叫中心系統(tǒng)解決方案 2011-05-06

熱點(diǎn)專題:  語音合成TTS 語音識(shí)別ASR  呼叫中心    電話營(yíng)銷
永安市| 子洲县| 迁安市| 灵寿县| 长泰县| 旬阳县| 驻马店市| 峨边| 嘉禾县| 商都县| 奉新县| 鹿泉市| 凤山县| 鲜城| 穆棱市| 大城县| 正镶白旗| 田东县| 二连浩特市| 都江堰市| 江都市| 桦南县| 新化县| 福清市| 丰宁| 芷江| 外汇| 苍梧县| 青海省| 文水县| 镇远县| 都昌县| 津市市| 丰原市| 亚东县| 阿合奇县| 白城市| 确山县| 宣威市| 湖州市| 余庆县|