亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

<pre id="ckeaw"></pre>

您當(dāng)前的位置是：首頁 > 新聞 > 文章精選 >

首頁|新聞|文章精選|商城|黃頁|會展|訪談|人才|供求|專家團(tuán)隊|周刊|呼叫中心|企業(yè)通信|通信業(yè)務(wù)

首頁 > 新聞 > 文章精選 >

Google視頻壓縮核心算法組工程師：詳解AV1研發(fā)現(xiàn)狀與未來

2018-09-28 10:24:39 作者：來源：CTI論壇評論：0 　點擊：

　　本文整理自 Google 視頻壓縮核心算法組軟件工程師陳誠在 RTC 2018 實時互聯(lián)網(wǎng)大會編解碼技術(shù)專場上的演講分享。他在演講中主要分享了 AV1 的研發(fā)現(xiàn)狀，詳細(xì)分享了 AV1 的編碼算法、編碼效果。如有任何問題，歡迎留言提問。

　　根據(jù)思科公司今年發(fā)布的報告稱，預(yù)計 2021 年，視頻將會成為互聯(lián)網(wǎng)產(chǎn)品的主要需求，超過80%的互聯(lián)網(wǎng)流量將會被視頻占據(jù)。屆時，與視頻相關(guān)的服務(wù)與需求將提升約50%，而其中對超高清的需求將提升約30%。同時，互聯(lián)網(wǎng)對直播和其它實時視頻服務(wù)的需求將會是目前的15倍。

　　如此快速的發(fā)展和快速增長的需求，正是互聯(lián)網(wǎng)公司推動新一代視頻編解碼技術(shù)的動力。

　　一、AV1 與 AOM 的概況

　　新一代編解碼技術(shù) AV1 已于2018年6月定稿，它有四個特點：

AV1 是一個開源、免費的生態(tài)系統(tǒng)，開放媒體聯(lián)盟（AOM）的成員都將支持 AV1
AOM 為 AV1 準(zhǔn)備了資金進(jìn)行法律方面的援助和專利保護(hù)
AV1 相對于前一代產(chǎn)品使用了更前沿的編碼技術(shù)，并取得了較好的壓縮效率
在 AOM 的合作框架內(nèi)為 AV1 提供了合作開放的環(huán)境

　　眾所周知，AV1 的前身是 Google 推出的 VP9。相對于 VP9，AV1 有三個特點：Performance、Platform、Potential。AOM 的框架使得 AV1 ，以及未來視頻的發(fā)展都更有活力。盡管 AV1 目前還處于研發(fā)和推廣初期，我們相信它在業(yè)界的廣大支持下，會獲得比 VP9 更廣泛的應(yīng)用。

　　開源媒體聯(lián)盟 AOM 由 Google、亞馬遜、思科等公司聯(lián)合牽頭成立，致力于推廣和研發(fā)多媒體的視頻編解碼技術(shù)。除了當(dāng)前與視頻行業(yè)緊密相連的互聯(lián)網(wǎng)公司外，該聯(lián)盟內(nèi)還有硬件設(shè)備廠商、內(nèi)容供應(yīng)商、主流瀏覽器廠商等。最近蘋果也加入了 AOM。業(yè)界的生態(tài)系統(tǒng)也都將支持 AV1。

　　AV1 工作組共有四個：軟件研發(fā)組、硬件研發(fā)組、Tapas 組、測試組。軟件和硬件研發(fā)組聯(lián)合進(jìn)行 AV1 的研發(fā)，同時測試組會對 AV1 的一致性進(jìn)行檢測。而 Tapas 組則進(jìn)行專利審核，并提供法律問題咨詢。

　　AV1 的研發(fā)組是個很有活力的社區(qū)。在整個 AV1 的研發(fā)過程中，已經(jīng)發(fā)表超過15篇學(xué)術(shù)論文，約有 100 多個研發(fā)提案被 AV1 采用。目前大家可以在網(wǎng)上下載到參考代碼，大約有30萬行代碼，并且平均每天會有15個代碼被提交上來。

　　AV1 從研發(fā)到推廣，將會分為四個階段：

第一階段，標(biāo)準(zhǔn)的研發(fā)與制定
第二階段，桌面瀏覽器對解碼的支持
第三階段，推廣 AV1 在更多硬件與軟件的支持
第四階段，在 AOM 生態(tài)系統(tǒng)中支持 AV1 的軟硬件編碼

　　從2015年的研發(fā)開始，到2018年6月的定稿，我們已經(jīng)完成了第一階段的目標(biāo)。目前，我們正處于第二階段，Google 的 Chrome 瀏覽器上已經(jīng)實現(xiàn)了軟件解碼。在未來的第三、第四階段中，我們的主要任務(wù)就是硬件設(shè)備與內(nèi)容供應(yīng)商對 AV1 的支持。預(yù)計2020年 AV1 將獲得更廣泛的應(yīng)用。

　　二、AV1 的編碼與算法

　　與其它視頻編碼軟件相似，AV1 的也分為一系列連續(xù)的模塊，包括分割、預(yù)測、變換、量化、熵編碼、環(huán)內(nèi)濾波等。在單元塊劃分上，AV1 支持更多的劃分模式和更大的劃分塊。其前身 VP9 支持最大劃分塊為 64x64，對每個方塊可以遞歸地進(jìn)行四個子塊的劃分。AV1 支持最大劃分塊為 128x128，對方塊遞歸的劃分有10種類型，最小的劃分塊為 4x4。

　　預(yù)測模式分為幀間預(yù)測和幀內(nèi)預(yù)測。在幀內(nèi)預(yù)測主要包含了四個主要工具：

支持更多多種的預(yù)測模式
支持從亮度值預(yù)測色度值
調(diào)色板模式
幀內(nèi)拷貝模式

　　AV1 支持56個方向的預(yù)測，利用當(dāng)前塊的上邊界和左邊界，重建的圖像，通過方向的差值來預(yù)測當(dāng)前塊的像素值。它的角度的表達(dá)方式是從8個主要的差值方向中，選擇其中之一，并用一個 Delta 值來確定精確的角度。

　　除了方向的預(yù)測之外，AV1還支持其它的方式對單個像素或當(dāng)前漸變塊生成預(yù)測。如下圖所示，有四種不同的差值方法對當(dāng)前值進(jìn)行預(yù)測，當(dāng)前值P將會由深藍(lán)色模塊的像素差值獲得。值得一提的是，另外一種遞歸的方式對漸變塊進(jìn)行預(yù)測，利用濾波的方式遞歸地對每個像素值進(jìn)行預(yù)測，在編解碼方面復(fù)雜度會有所提升。

　　從亮度值預(yù)測色度值的工具，它利用了視頻圖像當(dāng)中亮度值通道與色度值通道具有高度相似性的特點，通過選擇適當(dāng)?shù)膮?shù)再以重建亮度值通道來預(yù)測色度值，這個工具對于游戲視頻具有很好的壓縮效果。

　　調(diào)色板模式將塊內(nèi)的元素當(dāng)做幾種離散的顏色，不同于直接傳輸像素本身的參數(shù)值，而是通過傳輸色塊的顏色編號實現(xiàn)壓縮的目的。AV1支持從8×8到64×64的塊，支持調(diào)色板模式，編碼器會自動根據(jù)視頻內(nèi)容選擇是否使用調(diào)色板模式，如圖所示的例子，左邊是一個當(dāng)前模塊被劃分成了3種不同的顏色塊，根據(jù)波前的方式逐個編碼塊內(nèi)的方塊，它的左側(cè)和上側(cè)的顏色信號將作為信息在熵編碼中被使用。調(diào)色板模式對于當(dāng)前塊有單一色調(diào)的場景十分有用，一般這種場景出現(xiàn)在屏幕內(nèi)容的壓縮當(dāng)中。

　　另一個對于屏幕內(nèi)容壓縮很重要的工具叫做幀內(nèi)拷貝。它的工作原理就是，在預(yù)測當(dāng)前塊時它會去搜索當(dāng)前幀已重建的圖像部分，比如下圖1中第二個字母 A 和第三個字母 A，它將找到第一個已經(jīng)被編碼的字母A預(yù)測塊，它的預(yù)測會非常準(zhǔn)確，可以達(dá)到提高壓縮效率的目的。圖形中包含了非常多的字母，就會通過幀內(nèi)拷貝的模式搜索到非常好的預(yù)測效果，大大提高了視頻壓縮效率，僅這幅圖來說，壓縮效率就提升了 50%。

　　幀間的壓縮工具比幀內(nèi)的壓縮工具更豐富。AV1 比 VP9 在參考幀的數(shù)量和結(jié)構(gòu)上有了進(jìn)一步的優(yōu)化，支持8個參考幀，并能夠使用其中的7個參考幀進(jìn)行預(yù)測，而 VP9 只使用了其中三個。AV1 還支持分層結(jié)構(gòu)進(jìn)行雙向預(yù)測。

　　在現(xiàn)在的視頻壓縮標(biāo)準(zhǔn)中，運動估計在比特率中占有很大一部分，運動的估計一般通過搜尋一個運動向量找到參考幀中對應(yīng)的塊對當(dāng)前塊進(jìn)行預(yù)測。在 AV1 里我們采用了一種方法叫做運動場投影的方法來獲取運動向量，它的工作原理是通過當(dāng)前幀的兩個參考幀，并且找到參考幀的對應(yīng)參考幀獲得一個運動軌跡，將運動軌跡投影到當(dāng)前來幀獲得兩個運動向量。當(dāng)物體是線性運動時，這兩個運動向量將能很好預(yù)測到物體的運動軌跡，并獲得更精準(zhǔn)的預(yù)測，從而幫我們獲得更好的壓縮效果。

　　在我們有了這些運動向量之后，我們還需要傳輸它們。而在現(xiàn)有視頻標(biāo)準(zhǔn)中，傳輸運動向量已經(jīng)占據(jù)了很大的比例。所以我們 AV1 中采取了一種叫做動態(tài)運動向量索引的方法，它不直接傳輸運動向量的具體坐標(biāo)值，而是傳輸它在運動列表中的序號，然后通過查詢得知所用的運動向量。運動向量通過運動場投影的方式獲得并加入到運動列表中。我們通過運動估計的測算將運動列表的向量值進(jìn)行排序，再通過編碼器選擇對好的序號傳輸給解碼器。

　　現(xiàn)在的視頻壓縮標(biāo)準(zhǔn)都支持雙向預(yù)測，當(dāng)我們有了兩個參考幀之后如何把它們?nèi)诤显谝黄鹕深A(yù)測塊是值得探討的問題。AV1 在這個方面支持了多種不同的方式來生成預(yù)測塊，包括平均值運動補償、加權(quán)運動補償、楔形分割預(yù)測等。

　　運動塊補償早在 H.263 時代就被提出，在這里被 AV1 采用。它的原理是利用平滑濾波的方式將兩個運動補償塊重疊在一起，特點是能夠消除運動的不連續(xù)性帶來的影響，以此提高預(yù)測準(zhǔn)確率。雙向預(yù)測中，我們可以通過調(diào)整兩個預(yù)測快的權(quán)重來達(dá)到生成不同預(yù)測快的目的。AV1 除了支持平均運動補償，還會根據(jù)參考幀的距離來加權(quán)生成預(yù)測塊，特點是當(dāng)一個參考幀距離現(xiàn)在幀非常近的時候它的預(yù)測準(zhǔn)確度可能更會高，于是我們給予它更高的權(quán)重，當(dāng)另一個參考幀距離比較遠(yuǎn)的時候我們會給予遠(yuǎn)處的參考幀一個更低的權(quán)重，權(quán)重并不直接通過比特流傳輸，會通過傳輸序號的方式在預(yù)設(shè)置的表格里查詢對應(yīng)的權(quán)重。

　　AV1 還支持楔形分割預(yù)測，可以彌補方塊運動補償中無法準(zhǔn)確模擬物體邊界的缺點。楔形分割已經(jīng)作為查表預(yù)存在編解碼器中，通過編碼器選擇合適的最佳的楔形分割方式傳輸比特流來告知解碼器。

　　方塊的運動補償有一個很大的問題，它無法模擬實際運動中的大量的卷曲和變換。AV1 采用了基于仿射變換的方塊補償來解決這個問題。AV1 支持從幀到幀的全局變換，也支持塊到塊的局部變換。

　　在變換處理方面，AV1 除了支持傳統(tǒng)的 DCT，還支持 ADST、fADST、IDT ，由于他們都是二維可分割的，所以 AV1 共支持16種組合。同時，AV1還支持多種尺寸的變換快，最大為64x64，最小為4x4，還支持長方形的變換塊尺寸。AV1 支持 DCT 是因為，它對自然信號具有近似最優(yōu)解的壓縮效果，而當(dāng)殘差信號為單調(diào)變化時，那么 ADST 和反向 ADST 會有很好的壓縮效果。全等變換對于視頻是階躍變換時，會有很好的壓縮效果。

　　相比 VP9，AV1 增加了很多變換尺寸和變換類型，這使得它的搜索空間大幅增加，編解碼復(fù)雜度也有所提升。

　　在量化方面，AV1 在 VP9 的基礎(chǔ)上增加了幾個新的工具，包括 Delta-q 和 Quantization matrix 等。這些工具使得 AV1 的量化有了更大的靈活性，它的特殊的使用場景下具有很好的使用效果，比如使用參數(shù)矩陣能夠提升主觀觀測的質(zhì)量。

　　在熵編碼方面，AV1 使用了多符號算數(shù)編碼，能有較高的吞吐量，具備快速概率模型自適應(yīng)的特點。

　　在視頻壓縮技術(shù)中，對變換后的系數(shù)矩陣的壓縮和傳輸將占比特流的絕大部分，甚至超過50%，AV1 里針對這個變換矩陣的傳輸使用了分層編碼的方法，分層編碼將使用兩次掃描對當(dāng)前塊的矩陣進(jìn)行壓縮，第一次掃描將會編碼系數(shù)的絕對值，第二次編碼將會編碼系數(shù)的符號。讓我們用一個例子來說明分層編碼的過程。如下圖所示，左側(cè)代表當(dāng)前的系數(shù)矩陣和掃描的順序，第一行表示第一次編碼，第一次編碼從終止位置開始，逆掃描方向逐漸走向起始位置，深黃色的塊表示當(dāng)前的像素值，淺黃色表示它能用到的周圍的數(shù)值信息，第二行表示第二次編碼從起始位置開始一直到終止位置，第一次編碼只編碼系數(shù)的絕對值，第二次編碼將編碼系數(shù)的符號。

　　環(huán)內(nèi)濾波是目前視頻標(biāo)準(zhǔn)的必要組成部分。AV1 除了有傳統(tǒng)的去區(qū)塊濾波器，還增加了新工具，比如約束方向增強濾波器（CDEF），還有幀超分辨率重建、環(huán)內(nèi)重建濾波器，以及電影顆粒膠片效果合成器。

　　AV1 的去區(qū)塊濾波器對 Y、U、V 三個信號通道分別采用不同的濾波強度。對 Y 通道，水平濾波和垂直濾波采用不同的濾波強度。這個設(shè)計為去區(qū)塊濾波增加了更多可優(yōu)化的空間。

　　約束方向增強濾波器（CDEF），應(yīng)用在去區(qū)塊濾波之后，對每一個8x8的塊估計物體的方向，并沿著物體方向采用增強濾波。它能保留物體邊緣的清晰度，提升重建圖像的質(zhì)量。

　　幀超分辨率重建，應(yīng)用在 CDEF 之后。它首先將圖像沿著水平方向降采樣，只對低分辨率圖像進(jìn)行編碼，在解碼器升采樣把低分率圖像還原為原分辨率。這個方法顯著提升了低碼率下的編解碼的主觀觀測質(zhì)量。

　　環(huán)內(nèi)重建濾波器，是另一個重要的增強圖像質(zhì)量的后期處理方法。它包含了兩種濾波器。編碼器從兩者中選擇其一。Wiener 濾波器采用可分離的對稱設(shè)計。自導(dǎo)向投影濾波器使用兩個重建信號的線性組合來近似真實信號。編碼器通過比較濾波結(jié)果，選擇合適的參數(shù)，并傳輸給解碼器。

　　電影膠片顆粒效果合成，是針對高質(zhì)量視頻而設(shè)計的一個工具。電影膠片的顆粒效果，很難用傳統(tǒng)的視頻壓縮方法保留。AV1 將顆粒效果合成作為后期處理的步驟，對顆粒效果單獨處理。它的工作原理是將電影膠片顆粒效果在編碼前從原視頻中分離出來。分離后的圖像進(jìn)行普通編解碼，而顆粒效果在最后與解碼后的圖像合成為最終的輸出視頻。

　　三、AV1 的壓縮效率對比

　　我們對比了 AV1 與 VP9 和 HEVC，嚴(yán)謹(jǐn)?shù)刂v，我們對比的是這幾種編碼標(biāo)準(zhǔn)所使用的參考軟件實現(xiàn)，AV1 使用的參考軟件實現(xiàn)是 Libaom，VP9使用的是 Libvpx，HEVC 使用的是 x265。我們的測試環(huán)境是 AWCY，它是一個公開的測試集，包含了30多個從360p 到1080p 的測試視頻文件，測試條件固定 QP60幀。在這樣的測試環(huán)境下，我們可以看到 Libaom 比 Libvpx 約有30%的壓縮效率提升，比 x265 有27%的效率提升。

　　Facebook 也在他們實際應(yīng)用場景中，對比測試了 AV1、VP9 和 H.264。AV1 的效率比 H.264 提升了 50%，比 VP9 提升了30%。

　　莫斯科國立大學(xué)每年也會進(jìn)行編碼器的效果測試，在他們的測試結(jié)果中，AV1 取得了最佳的壓縮效果，明顯超越了 H.264、H.265 和 VP9。

　　我們都知道，現(xiàn)在的視頻壓縮標(biāo)準(zhǔn)用更高的編解碼復(fù)雜度換取視頻壓縮效率的提升，當(dāng)然實際應(yīng)用中我們不可能無限制提高編解碼復(fù)雜度，那平衡點在哪里呢？對于視頻點播的公司而言 Netflix 給出了他們的回答。他們認(rèn)為 AV1 的編解碼復(fù)雜度，如果能控制在 VP9 的 4-10 倍，就可以應(yīng)用于他們的產(chǎn)品中。我們 AV1 的復(fù)雜度是多少呢？截止今年8月初，我們對比了 AV1 與 VP9 在速度 0 到速度 3 的編碼復(fù)雜度。先解釋一下，速度 0 表示壓縮效率最高，但速度最慢，速度 3 反之。相比于 VP9，AV1 在速度0是 VP9的70倍，在速度3則已經(jīng)降低到10倍以內(nèi)。AOM 軟件開發(fā)組正在進(jìn)行AV1編解碼的優(yōu)化，這個數(shù)值也在不斷下降。

　　四、AV1的下一步演進(jìn)

　　AV1 當(dāng)前的重要目標(biāo)是編解碼的優(yōu)化，在編碼端需要更多的 SIMD 代碼支持，還要重新設(shè)計編碼，尤其是降低在硬件端的復(fù)雜度。在編碼方面，我們需要加快編碼速度，我們需要更高效的分割算法，更優(yōu)的濾波器類型、編碼類型、運動估計算法等。

　　在 AV1 中，我們使用了很多機器學(xué)習(xí)算法，它使得 AV1 能做出很多快速的決定，比如對搜尋方塊劃分的類型。我們相信在接下來的工作中，更好的機器學(xué)習(xí)算法會有助于 AV1 視頻編解碼的加速。我們在未來還將繼續(xù)嘗試其它新的視頻壓縮工具，比如光流的算法、基于機器學(xué)習(xí)的預(yù)測與合成的算法、基于機器學(xué)習(xí)的變換方法等。相信在 AOM 的框架下，以及各個成員與整個生態(tài)系統(tǒng)的支持下，AV1 在不久的將來會獲得更廣泛的應(yīng)用。

　　現(xiàn)場提問

　　觀眾：AV1什么時候可以讓所有人使用上？

　　陳誠：目前 AV1 處于第二階段，我們已經(jīng)完成了標(biāo)準(zhǔn)的定稿以及瀏覽器軟件解碼的支持。未來一兩年內(nèi)會完成與硬件相關(guān)的設(shè)計與優(yōu)化，預(yù)計在2020年，AOM 組織內(nèi)的成員將都支持 AV1，那時任何人都可以使用到它。

　　觀眾：我們很關(guān)心 AV1的性能問題。跟其它編碼器相比，在同樣的質(zhì)量條件下，壓縮同樣的內(nèi)容能節(jié)省多少碼率。剛剛您已經(jīng)提供了一些比較詳細(xì)的數(shù)據(jù)。我有一個疑問，印象中，在 Facebook 的測試中，與 H.264進(jìn)行對比，AV1能節(jié)省一半的碼率，我們知道 HEVC 和 H.264 的比較也是提升了一半。從這個角度講，AV1 和 H.265壓縮比應(yīng)該是相當(dāng)?shù)�。但從其它報告來看，又顯示 AV1 略勝于 H.265，但是數(shù)據(jù)略有浮動，有的是20%，有的是40%。您能提供一個比較權(quán)威的對比解讀么？AV1到底比 H.265 強多少？

　　陳誠：我的說法僅是個人意見，無法作為官方解釋來參考。不同的測試環(huán)境會導(dǎo)致測試效果的不同。我認(rèn)為有兩方面的差異導(dǎo)致了結(jié)果不同。首先是所使用的測試集，其次就是測試條件不同。關(guān)于測試條件，AV1 的研發(fā)目前主要為互聯(lián)網(wǎng)公司的視頻點播提供壓縮算法。以 youtube 和 Netflix 來說，他們是給一個固定的碼流來進(jìn)行壓縮，而AV1與HEVC的對比是基于固定 QP 作為對比條件。AV1 的設(shè)計初衷是在一個固定碼流下進(jìn)行壓縮，并沒有針對固定 QP 進(jìn)行優(yōu)化。這就導(dǎo)致了在很多的對比測試中，AV1 看起來并沒有比 HEVC 提升多少。我在解釋是基于 youtube、Netflix 等公司在實際應(yīng)用環(huán)境中的測試結(jié)果，他們認(rèn)為 AV1 已經(jīng)超過了 H.264、H.265。

【免責(zé)聲明】本文僅代表作者本人觀點，與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立，不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考，并請自行承擔(dān)全部責(zé)任。

相關(guān)熱詞搜索： Google

上一篇:首次呼叫解決率促進(jìn)客戶聯(lián)絡(luò)中心的績效改善

下一篇:最后一頁

相關(guān)閱讀：

評論排行

推薦閱讀

專題

滴滴事件的反思與前瞻: 　　2018年8月24日下午，浙江溫州樂清市20歲女孩趙某在...[詳細(xì)]

PureConnect一體化...: 向客戶提供全渠道的客服體驗，是企業(yè)刻不容緩的戰(zhàn)略目標(biāo)...[詳細(xì)]

inbound聯(lián)絡(luò)中心新...: 在呼叫中心運行inbound操作從來都不簡單。但是在今天的...[詳細(xì)]

2018中國客戶體驗...: 由CTI論壇主辦的2018中國客戶體驗創(chuàng)新大會將于2018年10...[詳細(xì)]

大家都在看

點擊排行
周排行
月排行

Copyright(C) 1999-2017 CTI論壇
All Rights Reserved CTI論壇版權(quán)所有

電話：+86-10-82012787，+86-10-82079677
傳真：+86-10-62041062
投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號513室（100088）

網(wǎng)站首頁 | 公司簡介 | 聯(lián)系方式 | 工作機會 | 廣告服務(wù) | 會員服務(wù) | 服務(wù)項目 | 專家團(tuán)隊 | 版權(quán)聲明 | 投稿方法

Copyright(C) 1999-2017 CTI論壇 All Rights Reserved CTI論壇版權(quán)所有

電話：+86-10-82012787，+86-10-82079677 傳真：+86-10-62041062 投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號513室（100088）

經(jīng)營性網(wǎng)站備案信息

京ICP證030771號

網(wǎng)絡(luò)110報警服務(wù)

京公網(wǎng)安備110102000104-1號

<dd id="yyoeu"></dd>

<abbr id="yyoeu"><s id="yyoeu"></s></abbr>

<blockquote id="yyoeu"><center id="yyoeu"></center></blockquote>