隨著5G、人工智能和物聯(lián)網(wǎng)的發(fā)展,疊加疫情對(duì)人類(lèi)生產(chǎn)生活方式的影響,聲音通信和交互的重要性不斷凸顯。但復(fù)雜噪聲環(huán)境會(huì)大大降低聲音通信的質(zhì)量和體驗(yàn),同時(shí)會(huì)導(dǎo)致語(yǔ)音識(shí)別的準(zhǔn)確率嚴(yán)重下降。聲音作為人類(lèi)感知信息、表達(dá)信息的重要手段,如何在新形勢(shì)下更好的發(fā)揮作用,這是深圳黃鸝智能科技有限公司(簡(jiǎn)稱(chēng)黃鸝智聲)一直在探索的方向。
黃鸝智聲是一家成立于2019年的人工智能技術(shù)企業(yè),依托清華團(tuán)隊(duì)20余年的研究積累,深耕聲音領(lǐng)域,尤其是聲音前端處理技術(shù)和相關(guān)產(chǎn)品的研發(fā)、應(yīng)用和服務(wù),致力于“用聲音智能改善人類(lèi)生活與工作品質(zhì)”。黃鸝智聲的團(tuán)隊(duì)成員們相信,今天科幻電影中的許多場(chǎng)景在不久的將來(lái)都將照進(jìn)現(xiàn)實(shí),未來(lái)的世界甚至?xí)由衿妫曇糇屓f(wàn)物互聯(lián),我們不僅通過(guò)聲音進(jìn)行人與人之間的溝通,還要讓萬(wàn)物聽(tīng)懂我們的聲音,從而更好的為我們服務(wù),并且聲音還會(huì)在物與物之間架起交互的橋梁。
說(shuō)起智能語(yǔ)音,大家想必都不陌生。國(guó)外有蘋(píng)果Siri,微軟小娜,GoogleAssistant,亞馬遜的Alexa;國(guó)內(nèi)有科大訊飛的靈犀助手,百度公司的小度,小米的小愛(ài)同學(xué)等等普通消費(fèi)者熟知的名字……而在呼叫中心行業(yè),智能語(yǔ)音也是異軍突起,語(yǔ)音質(zhì)檢、智能客服等應(yīng)用不斷呈現(xiàn)。然而,環(huán)境噪聲的干擾以及電聲器件的限制,極大地降低了聲音采集的精度和范圍;聲音前端處理技術(shù)的發(fā)展相對(duì)滯后,嚴(yán)重制約著智能聲音的應(yīng)用場(chǎng)景和效果:試想如果連最基本的聲音信息都不能聽(tīng)清、聽(tīng)懂,談何后面的數(shù)據(jù)傳達(dá)和解析呢?
黃鸝智聲的通話(huà)降噪技術(shù)方案與其他技術(shù)將聲音前端處理視作孤立的子系統(tǒng)并逐級(jí)連接不同,該技術(shù)方案從聽(tīng)覺(jué)的生理和心理基本原理出發(fā),創(chuàng)新性的將麥克風(fēng)陣列、聽(tīng)覺(jué)場(chǎng)景分析、深度學(xué)習(xí)和Gammatone濾波器組等技術(shù)相融合,形成完整并具有針對(duì)性的聲音前端智能處理方案,實(shí)現(xiàn)噪聲抑制、混響消除、陣列增益、目標(biāo)聲信號(hào)分離、跟蹤、增強(qiáng)等功能的統(tǒng)一,在降噪的同時(shí)對(duì)目標(biāo)聲音進(jìn)行提取,從而在保證高降噪的同時(shí)達(dá)到目標(biāo)信號(hào)低失真的效果。能夠在各類(lèi)復(fù)雜的強(qiáng)噪聲環(huán)境中實(shí)現(xiàn)清晰的聲音拾取,降噪效果高達(dá)40dB以上,且聲音信號(hào)的質(zhì)量MOS分在各類(lèi)噪聲環(huán)境下降噪后仍能達(dá)到平均4.0分以上。達(dá)到行業(yè)內(nèi)特有的:
。1)高降噪的同時(shí)保證聲音信息的低失真,性能行業(yè)首屈一指;
(2)針對(duì)難以處理的動(dòng)態(tài)多種類(lèi)噪音都有穩(wěn)定的降噪拾取性能,適用于多場(chǎng)景多領(lǐng)域。
(3)軟硬結(jié)合的方案在芯片平臺(tái)上即可實(shí)現(xiàn),延時(shí)低可靠性高。
黃鸝智聲所研發(fā)的產(chǎn)品和方案不僅能夠?qū)⒄Z(yǔ)音清晰拾取,為通話(huà)對(duì)方帶來(lái)靜謐的通話(huà)體驗(yàn);還適用于各種噪音場(chǎng)景中的智能語(yǔ)音應(yīng)用,有效提升識(shí)別準(zhǔn)確率,本次CTI大會(huì)也將接入由黃鸝智聲提供的語(yǔ)音識(shí)別系統(tǒng),將會(huì)場(chǎng)嘈雜的聲音變?yōu)榍逦恼Z(yǔ)音內(nèi)容再轉(zhuǎn)成精準(zhǔn)的文字記錄。
