亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

<center id="8ui2o"><strong id="8ui2o"></strong></center>

<code id="8ui2o"><dfn id="8ui2o"></dfn></code>

您當(dāng)前的位置是：首頁 > 資訊 > 文章精選 >

首頁|資訊|文章精選|商城|黃頁|會展|訪談|人才|資源|專家團(tuán)隊(duì)|周刊|呼叫中心|企業(yè)通信|通信業(yè)務(wù)

首頁 > 資訊 > 文章精選 >

構(gòu)建下一代ASR：語音情感識別應(yīng)用程序

2021-09-09 09:29:29 作者：來源：CTI論壇評論：0 　點(diǎn)擊：

老秦夜譯

　　CTI論壇(ctiforum.com)（編譯/老秦）:在2021年冬季出版的《語音技術(shù)》（Speech Technology）中，我討論了語音情感識別（SER）的潛在使用案例及其增強(qiáng)客戶體驗(yàn)的能力（“語音情感識別：用戶體驗(yàn)的下一步”）�，F(xiàn)在，讓我們繼續(xù)討論SER的挑戰(zhàn)，以及如何構(gòu)建下一代SER應(yīng)用程序。

　　真實(shí)語音情感數(shù)據(jù)集的可用性有限

　　作為一個領(lǐng)域，SER已有20多年的歷史，但與自動語音識別（ASR）相比，SER相對較新。今天，由于人工智能在該領(lǐng)域的應(yīng)用，ASR已經(jīng)真正起飛。另一方面，SER的速度較慢，因?yàn)榕cASR不同，用于訓(xùn)練AI模型的數(shù)據(jù)相當(dāng)有限。

　　傳統(tǒng)的SER數(shù)據(jù)集要么是作用的，要么是誘導(dǎo)的。表演數(shù)據(jù)集是由付費(fèi)演員用特定的情感說出固定的短語創(chuàng)建的。誘導(dǎo)數(shù)據(jù)集比這些稍有改進(jìn)，通過讓演講者觀看特定的片段或讓他們想象特定的情況，可以引發(fā)某些情緒。這些數(shù)據(jù)集是稀疏的，我們今天所設(shè)想的那種SER用例需要在交互式對話中進(jìn)行自動情感檢測；在這些數(shù)據(jù)集上訓(xùn)練的人工智能模型在現(xiàn)實(shí)世界中不會很好地工作。在預(yù)定義/有限情緒的語音片段上訓(xùn)練和測試的SER系統(tǒng)將無法在實(shí)際使用中處理自發(fā)語音。

　　請注意，約束條件不是真實(shí)世界充滿情感的語音的可用性，而是對數(shù)據(jù)進(jìn)行注釋/標(biāo)記以創(chuàng)建標(biāo)準(zhǔn)化數(shù)據(jù)集。與其他類型的數(shù)據(jù)（例如圖像）相比，標(biāo)記語音的情感內(nèi)容可能更加主觀。這就引出了下一個問題：語音情感建模。

　　情感建模是復(fù)雜的

　　語音情感建模，即如何表達(dá)嵌入語音中的情感，既復(fù)雜又關(guān)鍵。傳統(tǒng)的方法之一是將語音情感建模為憤怒、不信任、恐懼、快樂、悲傷或中性的主要類別之一。與基于離散類別的方法相比，機(jī)器學(xué)習(xí)更傾向于基于維度的方法。在前者中，使用了語音的聲學(xué)特征，包括語言和非語言。可以使用聲音（光譜信息、能量）、韻律（語調(diào)、強(qiáng)度、節(jié)奏）等技術(shù)特征的組合來訓(xùn)練SER模型。

　　非語言發(fā)聲，如笑、嘆氣、呼吸和猶豫/暫停，包含用于情緒檢測的有用信號。我們還需要考慮非情緒性條件，這些條件與聲音聽起來如何有關(guān)，例如疲勞、感冒、飲酒或其他物質(zhì)。面向消費(fèi)者的SER應(yīng)用必須處理多種語言、跨文化語音模式、遠(yuǎn)場聲學(xué)、說話人識別、群體動力學(xué)、語音轉(zhuǎn)換等問題。

　　盡管我們在這里討論的是SER，但任何其他非語音線索（如視覺信息）也可以作為模型的輸入。例如，在某些場景中，音頻和視頻內(nèi)容都可能可用。語音文本本身可以使用自然語言處理（NLP）進(jìn)行分析。除了字面上的解釋，NLP有可能幫助發(fā)現(xiàn)諷刺或幽默。

　　所有這些都表明了擁有高質(zhì)量數(shù)據(jù)的重要性。數(shù)據(jù)集的豐富性將決定SER的性能。機(jī)器學(xué)習(xí)技術(shù)在這里扮演著重要角色：

半監(jiān)督學(xué)習(xí)技術(shù)可用于標(biāo)記數(shù)據(jù)。在這里，人類研究人員標(biāo)記一小部分?jǐn)?shù)據(jù)，并讓算法標(biāo)記語料庫的其余部分。
這種方法的一個擴(kuò)展是主動學(xué)習(xí)，在這種學(xué)習(xí)中，有一個人在循環(huán)中，以提高自動標(biāo)簽的質(zhì)量。在主動學(xué)習(xí)中，如果算法對其數(shù)據(jù)分類的可信度較低，它會將語音數(shù)據(jù)路由到人工注釋器。
合成語音數(shù)據(jù)可使用少量真實(shí)語音生成，可使用生成對抗網(wǎng)絡(luò)（GAN）等技術(shù)使其接近真實(shí)語音質(zhì)量。
轉(zhuǎn)移學(xué)習(xí)是指將知識從一個環(huán)境應(yīng)用到另一個環(huán)境，可能是有用的。示例包括利用成人情緒模型進(jìn)行兒童情緒識別訓(xùn)練，或使用非語音音頻（如音樂）訓(xùn)練SER模型。

　　總之，語音情感識別是一個復(fù)雜的領(lǐng)域，包括語言和非語言、上下文甚至視覺的許多活動部分。機(jī)器學(xué)習(xí)和人工協(xié)助將在下一代SER應(yīng)用中發(fā)揮重要作用。

　　聲明:版權(quán)所有非合作媒體謝絕轉(zhuǎn)載

　　作者：Kashyap Kompella

　　原文網(wǎng)址：

　　https://www.speechtechmag.com/Articles/Columns/Interact/Building-the-Next-Generation-of-ASR-Speech-Emotion-Recognition-Apps-148837.aspx

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn)，與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點(diǎn)判斷保持中立，不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考，并請自行承擔(dān)全部責(zé)任。

相關(guān)熱詞搜索：語音情感識別 ASR SER

上一篇:將UCaaS和CCaaS與您的企業(yè)云戰(zhàn)略配對

下一篇:最后一頁

相關(guān)閱讀：

·語音情感識別：用戶體驗(yàn)的下一步2021-04-12 09:26:25
·ASR技術(shù)是呼叫中心語音自助服務(wù)的基礎(chǔ)2015-08-14 13:46:29
·Serverless Computing：這才是云計(jì)算該有的樣子？2021-08-10 10:46:12
·一文詳解 Serverless 架構(gòu)模式2020-07-10 10:23:57
·國際呼叫中心技術(shù)淺談3——Serverless架構(gòu)2019-10-11 11:00:35

評論排行

推薦閱讀

專題

InfoComm China 2021: 北京InfoComm China 2021已于上周五（7月23日）正式落...[詳細(xì)]

變革時代聯(lián)絡(luò)中心...: 　　該系列文章探討了推動變革的趨勢，回顧了當(dāng)今聯(lián)絡(luò)中...[詳細(xì)]

2021中國呼叫中心...: 2021中國呼叫中心及企業(yè)通信大會 4月15日中國·北京 ...[詳細(xì)]

華為全聯(lián)接2020: 華為第五屆HUAWEI CONNECT大會在上海舉辦。[詳細(xì)]

大家都在看

點(diǎn)擊排行
周排行
月排行

CTI論壇會員企業(yè)

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079688
傳真：+86-10-62041062
投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號513室（100088）

網(wǎng)站首頁 | 公司簡介 | 聯(lián)系方式 | 工作機(jī)會 | 廣告服務(wù) | 會員服務(wù) | 服務(wù)項(xiàng)目 | 專家團(tuán)隊(duì) | 版權(quán)聲明 | 投稿方法

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079688 投稿：ctiforum@ctiforum.com

經(jīng)營性網(wǎng)站備案信息

京ICP證030771號

網(wǎng)絡(luò)110報(bào)警服務(wù)

京公網(wǎng)安備110102000104-1號

<th id="4kge4"></th>