亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當(dāng)前的位置是:  首頁(yè) > 資訊 > 國(guó)內(nèi) >
 首頁(yè) > 資訊 > 國(guó)內(nèi) >

標(biāo)貝科技聲音理解功能上線 助力推進(jìn)個(gè)性化語(yǔ)音交互時(shí)代

2021-12-17 14:14:36   作者:   來源:CTI論壇   評(píng)論:0  點(diǎn)擊:


  古有聽聲辨位,今有聽聲"識(shí)"人。說到聲音,其本質(zhì)是不同頻率聲音的集合,以波的形式振動(dòng)(震動(dòng))傳播。由于每個(gè)人的發(fā)聲器官(口腔、鼻腔、聲帶)各不相同,因此每個(gè)人的聲音也不一樣。因而,你的聲音代表了個(gè)人很多關(guān)鍵信息,例如,性別、年齡、音色等特征。
  前幾年,韓國(guó)大熱的刑偵劇《Voice》里,女主是一個(gè)報(bào)警中心電話接聽員,天生聽力過人,不僅能聽到很多常人聽不到的細(xì)小微弱的聲音,還能分辨出人講話的聲音、物體碰撞的聲音、環(huán)境背景音等,靠著這個(gè)聽聲辨物的"超能力",女主通過現(xiàn)場(chǎng)聲音,準(zhǔn)確的分辨人、物、地點(diǎn),幫助組員破獲了很多案件和解救人質(zhì)。
  如今,這種通過解讀聲音來識(shí)人辨物,已經(jīng)完全能靠人工智能來實(shí)現(xiàn)了,即眾所周知的聲音識(shí)別。
  在我們?nèi)粘I町?dāng)中,聲音識(shí)別已經(jīng)應(yīng)用得非常廣泛了。比如說我們平時(shí)使用一些智能家居設(shè)備時(shí),通過語(yǔ)音進(jìn)行指令操控;在不方便進(jìn)行手動(dòng)輸入的場(chǎng)景下,可以通過語(yǔ)音輸入,進(jìn)行網(wǎng)頁(yè)搜索、導(dǎo)航設(shè)定、文本錄入,動(dòng)嘴不動(dòng)手,方便快捷。
  但僅僅是這樣還不夠。在實(shí)際的應(yīng)用場(chǎng)景里,用戶的說話環(huán)境往往包含各種各樣的噪聲,會(huì)在一定程度上污染說話人的聲音信號(hào),使算法無法準(zhǔn)確獲取說話人的聲紋特征;甚至由于說話人過多,無法準(zhǔn)確分離出目標(biāo)人的聲音,提取不到準(zhǔn)確的聲紋特征等因素,都會(huì)對(duì)識(shí)別效果有影響。
  標(biāo)貝科技立足于對(duì)AI的理解,依托先進(jìn)的語(yǔ)音交互技術(shù),以語(yǔ)言和語(yǔ)音為入口,持續(xù)研發(fā)全新的AI語(yǔ)音能力,打造更懂用戶的語(yǔ)音服務(wù)和更接地氣的語(yǔ)音產(chǎn)品,目前已經(jīng)推出中英文語(yǔ)音識(shí)別、多語(yǔ)種語(yǔ)音合成、聲音轉(zhuǎn)換和聲紋識(shí)別服務(wù),均得到落地應(yīng)用。與此同時(shí),標(biāo)貝科技持續(xù)深挖細(xì)分領(lǐng)域,全新上線聲音理解功能,不僅能聽懂用戶說什么,還能鑒定用戶身份。
  標(biāo)貝科技聲音理解,即通過聲音識(shí)別基本算法,自動(dòng)對(duì)說話人的語(yǔ)音信號(hào)進(jìn)行特征提取,構(gòu)建聲音分析框架,由機(jī)器進(jìn)行語(yǔ)音數(shù)據(jù)分析,快速區(qū)分噪音與人聲,并判定發(fā)音人性別和年齡段,進(jìn)行更加精準(zhǔn)化的信息匹配。
  在應(yīng)用場(chǎng)景上,聲音理解功能尤為有意義。在人機(jī)交互系統(tǒng)中,可以通過說話人的性別和年齡確定說話人所屬的特定人群,從而更有針對(duì)性的進(jìn)行交互。
  在智能家居領(lǐng)域,智能音箱、智能語(yǔ)音助手可以利用聲音理解的"辨認(rèn)"技術(shù),得出其性別、年齡、歷史偏好等信息,提供個(gè)性化服務(wù),如針對(duì)老年人、兒童等年齡段用戶,按照興趣推薦不同的歌曲、新聞,對(duì)設(shè)備控制權(quán)限進(jìn)行安全控制,讓機(jī)器更智能。
  在智能客服場(chǎng)景里,基于語(yǔ)義的自動(dòng)電話銷售已經(jīng)成為行業(yè)常態(tài),而通過聲音理解功能對(duì)語(yǔ)音客服的音頻數(shù)據(jù)進(jìn)行分析,構(gòu)造實(shí)時(shí)準(zhǔn)確的用戶畫像,能做到對(duì)不同電銷客戶的精準(zhǔn)推送,大大降低獲客成本,提升用戶活躍度,增強(qiáng)變現(xiàn)能力。
  在刑事偵查中,警方可以根據(jù)用戶的年齡和性別進(jìn)行訪問授權(quán),快速確定說話人的性別和年齡,有助于縮小搜索范圍,并為分析犯罪心理和行為分析提供依據(jù)。
  總的來說,聲音作為人們進(jìn)行信息交流最方便、有效的方式,未來必然也是人機(jī)交互的不可或缺的載體。隨著多種語(yǔ)音交互技術(shù)的不斷成熟和融合,語(yǔ)音交互越來越多的轉(zhuǎn)向個(gè)性化需求,結(jié)合語(yǔ)音識(shí)別、聲紋識(shí)別等多元技術(shù),聲音理解能力將逐漸融入人們的日常生活,產(chǎn)生巨大的應(yīng)用價(jià)值。標(biāo)貝科技也將持續(xù)推動(dòng)AI語(yǔ)音技術(shù)創(chuàng)新研發(fā),助力企業(yè)與開發(fā)者實(shí)現(xiàn)更多個(gè)性化語(yǔ)音解決方案的落地。
  標(biāo)貝科技【聲音理解】服務(wù)已于12月16日在標(biāo)貝科技官網(wǎng)與標(biāo)貝開放平臺(tái)同步上線公測(cè),免費(fèi)體驗(yàn)地址:
(1)標(biāo)貝科技官網(wǎng):https://www.data-baker.com/
(2)標(biāo)貝開放平臺(tái):https://ai.data-baker.com/#/index?source=gzh001
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與CTI論壇無關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。

專題

CTI論壇會(huì)員企業(yè)