亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

<sup id="asosq"></sup>

<center id="asosq"><tr id="asosq"></tr></center>

您當(dāng)前的位置是：首頁(yè) > 資訊 > 文章精選 >

首頁(yè)|資訊|文章精選|商城|黃頁(yè)|會(huì)展|訪談|人才|專家團(tuán)隊(duì)|周刊|呼叫中心|企業(yè)通信|通信業(yè)務(wù)

首頁(yè) > 資訊 > 文章精選 >

WebRTC系列之音頻的那些事

2020-06-23 10:59:24 作者：網(wǎng)易云信資深客戶端開發(fā)工程師來(lái)源：網(wǎng)易云信評(píng)論：0 　點(diǎn)擊：

　　年初因?yàn)楣ぷ餍枰�，開始學(xué)習(xí)WebRTC，被其復(fù)雜的編譯環(huán)境和巨大的代碼量所折服，注定是一塊難啃的骨頭。俗話說萬(wàn)事開頭難，堅(jiān)持一個(gè)恒心，終究能學(xué)習(xí)到WebRTC的設(shè)計(jì)精髓。

　　今天和大家聊聊WebRTC中音頻的那些事。WebRTC由語(yǔ)音引擎，視頻引擎和網(wǎng)絡(luò)傳輸三大模塊組成，其中語(yǔ)音引擎是WebRTC中最具價(jià)值的技術(shù)之一，實(shí)現(xiàn)了音頻數(shù)據(jù)的采集、前處理、編碼、發(fā)送、接受、解碼、混音、后處理、播放等一系列處理流程。

　　音頻引擎主要包含：音頻設(shè)備模塊ADM、音頻編碼器工廠、音頻解碼器工廠、混音器Mixer、音頻前處理APM。

　　音頻工作機(jī)制

　　想要系統(tǒng)的了解音頻引擎，首先需要了解核心的實(shí)現(xiàn)類和音頻數(shù)據(jù)流向，接下來(lái)我們將簡(jiǎn)單的分析一下。

　　音頻引擎核心類圖

　　音頻引擎WebrtcVoiceEngine主要包含音頻設(shè)備模塊AudioDeviceModule、音頻混音器AudioMixer、音頻3A處理器AudioProcessing、音頻管理類AudioState、音頻編碼器工廠AudioEncodeFactory、音頻解碼器工廠AudioDecodeFactory、語(yǔ)音媒體通道包含發(fā)送和接受等。

音頻設(shè)備模塊AudioDeviceModule主要負(fù)責(zé)硬件設(shè)備層，包括音頻數(shù)據(jù)的采集和播放，以及硬件設(shè)備的相關(guān)操作。
音頻混音器AudioMixer主要負(fù)責(zé)音頻發(fā)送數(shù)據(jù)的混音（設(shè)備采集和伴音的混音）、音頻播放數(shù)據(jù)的混音（多路接受音頻和伴音的混音）。
音頻3A處理器AudioProcessing主要負(fù)責(zé)音頻采集數(shù)據(jù)的前處理，包含回聲消除AEC、自動(dòng)增益控制AGC、噪聲抑制NS。APM分為兩個(gè)流，一個(gè)近端流，一個(gè)遠(yuǎn)端流。近端（Near-end）流是指從麥克風(fēng)進(jìn)入的數(shù)據(jù)；遠(yuǎn)端（Far-end）流是指接收到的數(shù)據(jù)。
音頻管理類AudioState包含音頻設(shè)備模塊ADM、音頻前處理模塊APM、音頻混音器Mixer以及數(shù)據(jù)流轉(zhuǎn)中心AudioTransportImpl。
音頻編碼器工廠AudioEncodeFactory包含了Opus、iSAC、G711、G722、iLBC、L16等codec。
音頻解碼器工廠AudioDecodeFactory包含了Opus、iSAC、G711、G722、iLBC、L16等codec。

　　音頻的工作流程圖

發(fā)起端通過麥克風(fēng)進(jìn)行聲音采集
發(fā)起端將采集到的聲音信號(hào)輸送給APM模塊，進(jìn)行回聲消除AEC，噪音抑制NS，自動(dòng)增益控制處理AGC
發(fā)起端將處理之后的數(shù)據(jù)輸送給編碼器進(jìn)行語(yǔ)音壓縮編碼
發(fā)起端將編碼后的數(shù)據(jù)通過RtpRtcp傳輸模塊發(fā)送，通過Internet網(wǎng)路傳輸?shù)浇邮斩?/li>
接收端接受網(wǎng)絡(luò)傳輸過來(lái)的音頻數(shù)據(jù)，先輸送給NetEQ模塊進(jìn)行抖動(dòng)消除，丟包隱藏解碼等操作
接收端將處理過后的音頻數(shù)據(jù)送入聲卡設(shè)備進(jìn)行播放

　　NetEQ模塊是Webrtc語(yǔ)音引擎中的核心模塊

　　在 NetEQ 模塊中，又被大致分為 MCU模塊和 DSP 模塊。

　　MCU 主要負(fù)責(zé)做延時(shí)及抖動(dòng)的計(jì)算統(tǒng)計(jì)，并生成對(duì)應(yīng)的控制命令。

　　而 DSP 模塊負(fù)責(zé)接收并根據(jù) MCU 的控制命令進(jìn)行對(duì)應(yīng)的數(shù)據(jù)包處理，并傳輸給下一個(gè)環(huán)節(jié)。

　　音頻數(shù)據(jù)流向

　　根據(jù)上面介紹的音頻工作流程圖，我們將繼續(xù)細(xì)化一下音頻的數(shù)據(jù)流向。將會(huì)重點(diǎn)介紹一下數(shù)據(jù)流轉(zhuǎn)中心AudioTransportImpl在整個(gè)環(huán)節(jié)中扮演的重要角色。

　　數(shù)據(jù)流轉(zhuǎn)中心AudioTransportImpl實(shí)現(xiàn)了采集數(shù)據(jù)處理接口RecordDataIsAvailbale和播放數(shù)據(jù)處理接口NeedMorePlayData。

　　RecordDataIsAvailbale負(fù)責(zé)采集音頻數(shù)據(jù)的處理和將其分發(fā)到所有的發(fā)送Streams。

　　NeedMorePlayData負(fù)責(zé)混音所有接收到的Streams，然后輸送給APM作為一路參考信號(hào)處理，最后將其重采樣到請(qǐng)求輸出的采樣率。

　　RecordDataIsAvailbale內(nèi)部主要流程：

由硬件采集過來(lái)的音頻數(shù)據(jù)，直接重采樣到發(fā)送采樣率
由音頻前處理針對(duì)重采樣之后的音頻數(shù)據(jù)進(jìn)行3A處理
VAD處理
數(shù)字增益調(diào)整采集音量
音頻數(shù)據(jù)回調(diào)外部進(jìn)行外部前處理
混音發(fā)送端所有需要發(fā)送的音頻數(shù)據(jù)，包括采集的數(shù)據(jù)和伴音的數(shù)據(jù)
計(jì)算音頻數(shù)據(jù)的能量值
將其分發(fā)到所有的發(fā)送Streams

　　NeedMorePlayData內(nèi)部主要流程：

　　1.混音所有接收到的Streams的音頻數(shù)據(jù)

　　1.1 計(jì)算輸出采樣率CalculateOutputFrequency（）

　　1.2 從Source收集音頻數(shù)據(jù)GetAudioFromSources（）,選取沒有mute，且能量最大的三路進(jìn)行混音

　　1.3 執(zhí)行混音操作FrameCombiner::Combine（）

　　2.特定條件下，進(jìn)行噪聲注入，用于采集側(cè)作為參考信號(hào)

　　3.對(duì)本地伴音進(jìn)行混音操作

　　4.數(shù)字增益調(diào)整播放音量

　　5.音頻數(shù)據(jù)回調(diào)外部進(jìn)行外部前處理

　　6.計(jì)算音頻數(shù)據(jù)的能量值

　　7.將音頻重采樣到請(qǐng)求輸出的采樣率

　　8.將音頻數(shù)據(jù)輸送給APM作為一路參考信號(hào)處理

　　由上圖的數(shù)據(jù)流向發(fā)現(xiàn)，為什么需要FineAudioBuffer和AudioDeviceBuffer？

　　因?yàn)閃ebRTC 的音頻流水線只支持處理 10 ms 的數(shù)據(jù)，不同的操作系統(tǒng)平臺(tái)提供了不同的采集和播放時(shí)長(zhǎng)的音頻數(shù)據(jù)，不同的采樣率也會(huì)提供不同時(shí)長(zhǎng)的數(shù)據(jù)。

　　例如iOS上，16K采樣率會(huì)提供8ms的音頻數(shù)據(jù)128幀；8K采樣率會(huì)提供16ms的音頻數(shù)據(jù)128幀；48K采樣率會(huì)提供10.67ms的音頻數(shù)據(jù)512幀。

　　AudioDeviceModule 播放和采集的數(shù)據(jù)，總會(huì)通過 AudioDeviceBuffer 拿進(jìn)來(lái)或者送出去 10 ms 的音頻數(shù)據(jù)。

　　對(duì)于不支持采集和播放 10 ms 音頻數(shù)據(jù)的平臺(tái)，在平臺(tái)的 AudioDeviceModule 和 AudioDeviceBuffer 還會(huì)插入一個(gè) FineAudioBuffer，用于將平臺(tái)的音頻數(shù)據(jù)格式轉(zhuǎn)換為 10 ms 的 WebRTC 能處理的音頻幀。

　　在AudioDeviceBuffer 中，還會(huì)10s定時(shí)統(tǒng)計(jì)一下當(dāng)前硬件設(shè)備過來(lái)的音頻數(shù)據(jù)對(duì)應(yīng)的采樣點(diǎn)個(gè)數(shù)和采樣率，可以用于檢測(cè)當(dāng)前硬件的一個(gè)工作狀態(tài)。

　　音頻相關(guān)改動(dòng)

音頻Profile的實(shí)現(xiàn)，支持Voip和Music 2種場(chǎng)景，實(shí)現(xiàn)了采樣率、編碼碼率、編碼模式、聲道數(shù)的綜合性技術(shù)策略。iOS實(shí)現(xiàn)了采集和播放線程的分離，支持雙聲道的播放。
音頻3A參數(shù)的兼容性下發(fā)適配方案。
耳機(jī)場(chǎng)景的適配，藍(lán)牙耳機(jī)和普通耳機(jī)的適配，動(dòng)態(tài)3A切換適配。
Noise_Injection噪聲注入算法，作為一路參考信號(hào)，在耳機(jī)場(chǎng)景的回聲消除中的作用特別明顯。
支持本地伴音文件file和網(wǎng)絡(luò)伴音文件http&https。
Audio Nack的實(shí)現(xiàn)，提高音頻的抗丟包能力，目前正在進(jìn)行In-band FEC。
音頻處理在單講和雙講方面的優(yōu)化。
iOS在Built-In AGC方面的研究：

　�。�1）Built-In AGC對(duì)于Speech和Music有效，對(duì)于noise和環(huán)境底噪不會(huì)產(chǎn)生作用。

　　（2）不同機(jī)型的麥克風(fēng)硬件的增益不同，iPhone 7 Plus > iPhone 8 > iPhone X;因此會(huì)在軟件AGC和硬件AGC都關(guān)閉的情況下，遠(yuǎn)端聽到的聲音大小表現(xiàn)不一樣。

　�。�3）iOS除了提供的可開關(guān)的AGC以外，還有一個(gè)AGC會(huì)一直工作，對(duì)信號(hào)的level進(jìn)行微調(diào)；猜想這個(gè)一直工作的AGC是iOS自帶的analog AGC，可能和硬件有關(guān)，且沒有API可以開關(guān)，而可開關(guān)的AGC是一個(gè)digital AGC。

　�。�4）在大部分iOS機(jī)型上，外放模式“耳機(jī)再次插入后”，input的音量會(huì)變小。當(dāng)前的解決方案是在耳機(jī)再次插入后，增加一個(gè)preGain來(lái)把輸入的音量拉回正常值。

　　音頻問題排查

　　和大家分享一下音頻最常見的一些現(xiàn)象以及原因：

　　以上就是我關(guān)于語(yǔ)音引擎的一些分享，歡迎大家留言與我探討。

【免責(zé)聲明】本文僅代表作者本人觀點(diǎn)，與CTI論壇無(wú)關(guān)。CTI論壇對(duì)文中陳述、觀點(diǎn)判斷保持中立，不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考，并請(qǐng)自行承擔(dān)全部責(zé)任。

相關(guān)熱詞搜索： WebRTC

上一篇:遷移實(shí)戰(zhàn)|從VMware和Hyper-V遷移到OpenStack

下一篇:最后一頁(yè)

相關(guān)閱讀：

·關(guān)于開源WebRTC視頻會(huì)議服務(wù)器性能以及測(cè)試據(jù)分享2020-06-15 09:47:40
·WebRTC-ICE/RFC5245中文詳解發(fā)布2020-05-29 09:33:42
·基于Open WebRTC Toolkit（OWT）的8K全景視頻低延時(shí)直播系統(tǒng)2020-04-15 14:00:45
·完整SIP/SDP媒體協(xié)商概論-SIP/WebRTC概要2020-02-17 10:46:41
·隨著WebRTC進(jìn)入第二個(gè)十年，2020年將會(huì)發(fā)生什么?2019-12-09 09:37:16
·WebRTC的安全性設(shè)計(jì)2019-09-17 10:03:02
·在CentOS環(huán)境下編譯asterisk和WebRTC實(shí)現(xiàn)通過網(wǎng)關(guān)呼入呼出2019-08-01 09:15:29
·WebRTC在網(wǎng)頁(yè)端音視頻通話的技術(shù)實(shí)踐2019-07-11 15:28:49
·從通信到AI FreeSWITCH與WebRTC2019-03-25 09:11:03
·使用WebRTC實(shí)現(xiàn)語(yǔ)音質(zhì)量的商業(yè)價(jià)值2019-03-04 10:54:19

評(píng)論排行

推薦閱讀

專題

2020中國(guó)呼叫中心...: 業(yè)界矚目的2020中國(guó)呼叫中心及企業(yè)通信大會(huì)將于7月9日在...[詳細(xì)]

語(yǔ)音技術(shù)行業(yè)現(xiàn)狀: 　　AI如此流行，從2019年開始一直延續(xù)到今年，我們?cè)谀?..[詳細(xì)]

遠(yuǎn)程辦公高效...: 抗擊疫情戰(zhàn)役進(jìn)入攻堅(jiān)階段，在家遠(yuǎn)程辦公將成為近日工作...[詳細(xì)]

呼叫中心遠(yuǎn)程座席...: 2020年一場(chǎng)突如其來(lái)的新冠肺炎，牽動(dòng)著每個(gè)人的心，疫情...[詳細(xì)]

大家都在看

點(diǎn)擊排行
周排行
月排行

CTI論壇會(huì)員企業(yè)

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079677
傳真：+86-10-62041062
投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號(hào)513室（100088）

網(wǎng)站首頁(yè) | 公司簡(jiǎn)介 | 聯(lián)系方式 | 工作機(jī)會(huì) | 廣告服務(wù) | 會(huì)員服務(wù) | 服務(wù)項(xiàng)目 | 專家團(tuán)隊(duì) | 版權(quán)聲明 | 投稿方法

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079677 投稿：ctiforum@ctiforum.com

經(jīng)營(yíng)性網(wǎng)站備案信息

京ICP證030771號(hào)

網(wǎng)絡(luò)110報(bào)警服務(wù)

京公網(wǎng)安備110102000104-1號(hào)

<center id="840i0"></center>

<source id="840i0"><strike id="840i0"></strike></source>

<abbr id="840i0"><em id="840i0"></em></abbr>

<samp id="840i0"></samp>

<li id="840i0"></li>

<center id="840i0"><optgroup id="840i0"></optgroup></center>