一、智能語音客服
目前,通信運營商等在客服領(lǐng)域比較先進的企業(yè)已經(jīng)實現(xiàn)了智能文字客服,通過文字識別技術(shù)和智能匹配算法對通過短信和網(wǎng)站文字客服提出的服務(wù)訴求智能匹配答案,不需人工判斷。要實現(xiàn)智能語音客服,也要通過識別和匹配這兩關(guān)。
我們先說說識別吧。早在Siri之前,就已經(jīng)有很多語音識別工具問世,最早的基于電子計算機的語音識別系統(tǒng)是由AT&T貝爾實驗室開發(fā)的Audrey語音識別系統(tǒng),它能夠識別10個英文數(shù)字,現(xiàn)在AT&T的語音系統(tǒng)Watson已經(jīng)可以實現(xiàn)在線德語和英語的實時口譯。以現(xiàn)在的技術(shù),語音的識別依然比較困難,主要面臨的難點有2個:
1.算法
算法是軟件的核心,目前的語音識別算法使用的語言模型仍是一種概率模型,還未發(fā)展成以語言學(xué)為基礎(chǔ)的文法模型,算法不突破,效果無法取得突飛猛進的進展。算法的優(yōu)化不是一朝一夕的事情,需要慢慢不斷地進行,尤其語音這種非結(jié)構(gòu)化數(shù)據(jù)(不便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)),但隨著大數(shù)據(jù)分析技術(shù)(用于非結(jié)構(gòu)化數(shù)據(jù)的管理分析)的發(fā)展,也會對新算法開發(fā)帶來福音。一些核心算法如特征提取、搜索算法和自適應(yīng)算法也都在一步步改進,且隨著數(shù)據(jù)源的不斷豐富,算法的識別效果也就越來越精準。
2.適應(yīng)性
由于方言、語氣、環(huán)境和音色等因素的影響,限制了語音識別算法的效果,這就需要語言識別系統(tǒng)具有一定的自適應(yīng)性,不同口音、方言的識別都需要以一個龐大的語音數(shù)據(jù)庫為基礎(chǔ),對這些非結(jié)構(gòu)化數(shù)據(jù)的管理分析就更加指望大數(shù)據(jù)技術(shù)了。至于排除環(huán)境噪音、音色等因素,個人感覺要依賴半導(dǎo)體傳感技術(shù)的進步,留待硬件領(lǐng)域的專家進一步探討。
接下來就說到匹配了。目前,匹配的算法已經(jīng)相對比較成熟了,也許和大數(shù)據(jù)技術(shù)沒有直接聯(lián)系,不過其準確性也有賴于數(shù)據(jù)源的豐富程度,同時要在不斷產(chǎn)生的“交互數(shù)據(jù)”中動態(tài)地調(diào)整匹配結(jié)果。
綜上所訴,隨著數(shù)據(jù)源越來越多,大數(shù)據(jù)技術(shù)的不斷進步,語音識別系統(tǒng)也在持續(xù)地完善之中,說到底,算法依然是核心,而數(shù)據(jù)則是基礎(chǔ),對于這類非結(jié)構(gòu)化數(shù)據(jù),也許傳統(tǒng)的數(shù)據(jù)庫技術(shù)Handle不住,但大數(shù)據(jù)技術(shù)卻大有可為。相信不久,語音識別的技術(shù)的突破不僅可以實現(xiàn)智能語音客服,還將變革人與物之間的交互方式。
二、語音文本轉(zhuǎn)換
因為這個功能的核心也是語音識別,所以大數(shù)據(jù)技術(shù)對的轉(zhuǎn)換準確度的保障支撐就不用再說了。之所以單列出來談呢,是因為其對客戶服務(wù)別有一番作用。
對于呼叫中心而言,客服人員與用戶的通話都是要錄音備份的,這些語音數(shù)據(jù)可真的不小哦,僅以廣東移動為例,廣東移動客服中心每年就要新增約60T的數(shù)據(jù)存儲,這個體量對于一般的企業(yè)來說已經(jīng)是“大數(shù)據(jù)”了。據(jù)悉,這些數(shù)據(jù)是用磁帶來保存的,而且這些要保存幾十年不能銷毀,想想到時候光這些磁帶所占用的房間租金就是不少錢啊,更何況是其他成本。而如果能將這些語音準確地轉(zhuǎn)換成文本之后,文本存儲所占用的空間就小的多(一個移動硬盤都可以存儲一個圖書館的數(shù)據(jù)量了),存儲成本簡直就是直線下降,不僅實現(xiàn)了低成本高效,對自然環(huán)境也是一種利好。