亚洲综合伊人,成人欧美一区二区三区视频不卡,欧美日韩在线高清,日韩国产午夜一区二区三区,大胆美女艺术,一级毛片毛片**毛片毛片,你瞅啥图片

您當(dāng)前的位置是：首頁 > 資訊 > 文章精選 >

首頁|資訊|文章精選|商城|黃頁|會展|訪談|人才|資源|專家團隊|周刊|呼叫中心|企業(yè)通信|通信業(yè)務(wù)

首頁 > 資訊 > 文章精選 >

圖像分割2020最新進展

2020-10-13 09:50:35 作者：Jakub Czakon 來源：LiveVideoStack 評論：0 　點擊：

　　該文章由Derrick Mwiti發(fā)表在Neptune blog，在這篇文章中，我們將會探討深度學(xué)習(xí)在圖像分割領(lǐng)域的應(yīng)用。

　　Posted by Jakub Czakon

　　url : https://towardsdatascience.com/image-segmentation-in-2020-756b77fa88fc

　　source來源：neptune.ai

在這篇文章中我們將討論的話題有：
什么是圖像分割
圖像分割的架構(gòu)
圖像分割中使用的損失函數(shù)
在你的圖像分割項目中可用的框架

　　就讓我們一探究竟吧。

　　什么是圖像分割

　　顧名思義，圖像分割是將一幅圖像轉(zhuǎn)化成多個部分的過程。在這個過程中，圖像中的每個像素都與一個具體的物體相關(guān)聯(lián)在一起。圖像分割主要有兩種類型：語義分割和實例分割。

　　在語義分割中，所有物體都是同一類型的，所有相同類型的物體都使用一個類標(biāo)簽進行標(biāo)記，而在實例分割中，相似的物體可以有自己獨立的標(biāo)簽。

　　參考Anurag Arnab, Shuai Zheng 等作者的2018年的Paper：“Conditional Random Fields Meet Deep Neural Networks for Semantic Segmentation” http://www.robots.ox.ac.uk/~tvg/publications/2017/CRFMeetCNN4SemanticSegmentation.pdf

　　圖像分割的架構(gòu)

　　圖像分割的基本結(jié)構(gòu)由編碼器和解碼器組成。

　　來自Vijay Badrinarayanan等作者2017的Paper：“SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation” https://arxiv.org/abs/1511.00561

　　編碼器通過過濾器從圖像中提取特征。解碼器負責(zé)生成最終輸出，通常是包含對象輪廓的分割掩碼（segmantation mask）。大多數(shù)架構(gòu)都有這種體系結(jié)構(gòu)或其變體。

　　讓我們看一看一些例子。

　　U-Net

　　U-Net是一個最初用于開發(fā)生物影響分割的卷積神經(jīng)網(wǎng)絡(luò)。從視覺上看，它的架構(gòu)看起來像字母U，因此而得名U-Net。它的架構(gòu)由兩部分組成，左邊是收縮路徑，右邊是擴展路徑。收縮路徑的目的是捕獲內(nèi)容，而擴展路徑的角色是幫助精確定位。

　　來自O(shè)laf Ronneberger等作者2015年的Paper “U-net architecture image segmentation” https://arxiv.org/abs/1505.04597

　　U-Net由右側(cè)的擴展路徑和左側(cè)的收縮路徑組成。收縮路徑由兩個3×3的卷積層組成。卷積之后是一個校正的線性單元和和一個2×2的max-pooling池化層的計算來做下采樣。

　　U-Net的完整實現(xiàn)可以在這里找到：https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

　　FastFCN — 快速全連接網(wǎng)絡(luò)

　　在這種結(jié)構(gòu)中，一個使用聯(lián)合金字塔上采樣（JPU）模塊來代替了擴展卷積網(wǎng)絡(luò)，因為卷積網(wǎng)絡(luò)消耗大量的內(nèi)存和計算時間。它使用一個完全連接的網(wǎng)絡(luò)作為核心，同時應(yīng)用JPU進行上采樣。JJPU將低分辨率的feature map上采樣為高分辨率的feature map。

　　來自Huikai Wu等作者2019的Paper “FastFCN: Rethinking Dilated Convolution in the Backbone for Semantic Segmentation” https://arxiv.org/abs/1903.11816

　　如果你想把通過代碼實現(xiàn)，查看這里：https://github.com/wuhuikai/FastFCN

　　Gated-SCNN

　　這個架構(gòu)由一個雙流CNN架構(gòu)組成。在該模型中，使用一個單獨的分支來處理圖像的形狀信息。形狀流用于處理邊界信息。

　　Towaki Takikawa等 al 2019年“Gated-SCNN：Gated Shape CNNs用于語義分割” https://arxiv.org/abs/1907.05740

　　代碼實現(xiàn)：https://github.com/nv-tlabs/gscnn

　　DeepLab（深度實驗室）

　　在這種體系結(jié)構(gòu)中，帶有上采樣濾波器的卷積用于涉及密集預(yù)測的任務(wù)。多個對象的分割是通過無空間金字塔空間池完成的。最后，利用DCNNs改進了目標(biāo)邊界的定位。通過插入零或輸入特征圖進行稀疏采樣來對濾波器進行上采樣，從而實現(xiàn)無用卷積。

　　陳良杰等人，2016年“ DeepLab：利用深度卷積網(wǎng)絡(luò)，Atrous卷積和全連接的CRF進行語義圖像分割” https://arxiv.org/abs/1606.00915

　　您可以在PyTorch（https://github.com/fregu856/deeplabv3）或TensorFlow（https://github.com/sthalles/deeplab_v3）上嘗試它的實現(xiàn)。

　　Mask R-CNN

　　在這個體系結(jié)構(gòu)中，使用一個邊界框/包圍盒和語義分割對對象進行分類和定位，該語義分割將每個像素分類為一組類別。每個感興趣的區(qū)域都有一個分割蒙版。并且將產(chǎn)生一個類標(biāo)簽和一個邊界框作為最終輸出。實際上該體系結(jié)構(gòu)是Faster R-CNN的擴展。Faster R-CNN由提出區(qū)域的深度卷積網(wǎng)絡(luò)和利用區(qū)域的檢測器組成。

　　Kaiming He et. al 2017 “Mask R-CNN” https://arxiv.org/abs/1703.06870

　　這是在COCO測試集上獲得的結(jié)果的圖像。

　　Kaiming He et. al 2017 “Mask R-CNN” https://arxiv.org/abs/1703.06870

　　圖像分割損失函數(shù)

　　語義分割模型在訓(xùn)練過程中通常使用一個簡單的跨類別熵損失函數(shù)。但是，如果您對獲取圖像的詳細信息感興趣的話，那么您必須恢復(fù)到稍微高級的損失函數(shù)。

　　我們來看看其中的幾個。

　　焦點損失

　　這個損失是對標(biāo)準(zhǔn)互熵標(biāo)準(zhǔn)的改進。這是通過改變其形狀來完成和實現(xiàn)的，以使分配給分類充分的示例的損失降低權(quán)重。最終，這確保了沒有階級不平衡的存在。在這個損失函數(shù)中，隨著對正確類別的置信度增加，交叉熵損失會隨著縮放因子以零衰減而縮放。比例因子在訓(xùn)練時自動降低權(quán)衡簡單示例的貢獻，并將重點放在難的示例上。

　　來源source:neptune.ai

　　骰子損失

　　這種損失是通過計算平滑骰子系數(shù)函數(shù)得到的。這種損失是最常用的損失，屬于是分割問題。

　　來源source:neptune.ai

　　IoU 平衡損失交集

　　IoU平衡的分類損失的目的是提高IoU高的樣本的梯度，降低低IoU樣本的梯度。這樣，通過這種方式，可以提高機器學(xué)習(xí)模型的定位精度。

　　來源source:neptune.ai

　　邊界損失

　　邊界損失的一種變體適用于分段高度不平衡的任務(wù)。這種損失的形式是空間輪廓\等高線而不是區(qū)域的距離度量。以這種方法，可以解決了由高度不平衡的分割任務(wù)中區(qū)域損失所帶來的問題。

　　來源source:neptune.al

　　加權(quán)交叉熵

　　在交叉熵的一個變量中，所有的正例子都被某個一定系數(shù)加權(quán)。它用于涉及類不平衡的場景或方案。

　　來源source:neptune.ai

　　Lovász-Softmax損失

　　該損失基于子模損失的凸Lovasz擴展，對神經(jīng)網(wǎng)絡(luò)中的平均相交-大于聯(lián)合損失進行直接優(yōu)化。

　　來源source:neptune.ai

　　其他值得一提的損失是：

TopK損失，其目的是確保網(wǎng)絡(luò)在訓(xùn)練過程中集中在硬樣本上。
距離損失的CE損耗將網(wǎng)絡(luò)引導(dǎo)到難以分割的邊界區(qū)域。
敏感性\靈敏性-特異性（SS）損失，用于計算特異性和敏感性的均方差的加權(quán)和。
Hausdorff 距離（HD）損失，可從卷積神經(jīng)網(wǎng)絡(luò)估計Hausdorff距離。

　　這些只是圖像分割中使用的幾個損失函數(shù)。要了解更多，請點此鏈接查看：https://github.com/JunMa11/SegLoss

　　圖像分割的數(shù)據(jù)集

　　如果你看到了這里的話，你會思考說從哪里可以獲得相應(yīng)的數(shù)據(jù)集來進行圖像分割的學(xué)習(xí)呢。

　　現(xiàn)在我們來看下有哪些數(shù)據(jù)集我們拿來用。

　　Common Objects in COntext — Coco數(shù)據(jù)集

　　COCO是一個大規(guī)模的物體檢測、圖像分割和五項描述生成的大規(guī)模數(shù)據(jù)集。這個數(shù)據(jù)集中一共包含91個物品類別。包含著250000帶有關(guān)鍵點標(biāo)注的人。它的下載大小是37.57GIB。它包含80個對象類別。它在Apache2.0許可下可用，可以從這里下載（https://cocodataset.org/#download）。

　　PASCAL可視化對象類（PASCAL VOC）

　　PASCAL有9963張圖片，有20個不同的類別。訓(xùn)練/驗證集是一個2GB的tar文件。數(shù)據(jù)集可以從官方網(wǎng)站下載：http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

　　Cityscapes 數(shù)據(jù)集

　　此數(shù)據(jù)集包含城市場景的圖像。它可以用來評價視覺算法在城市場景中的性能。數(shù)據(jù)集可以從這里下載：https://www.cityscapes-dataset.com/。

　　Cambridge駕駛標(biāo)注視頻數(shù)據(jù)庫 — CamVid

　　這是一個基于運動的分割和識別數(shù)據(jù)集。它包含32個語義類別。此鏈接包含進一步的解釋和指向數(shù)據(jù)集的下載鏈接：http://mi.eng.cam.ac.uk/research/projects/VideoRec/CamVid/。

　　圖像分割框架

　　現(xiàn)在您已經(jīng)準(zhǔn)備好了可使用的數(shù)據(jù)集，下面讓我來介紹一些可以用來入門的工具/框架。

FastAI庫——給定一個圖像，這個庫可以創(chuàng)建圖像中對象的掩碼/遮罩。
Sefexa圖像分割工具-——Sefexa是一個免費的工具，可用于半自動圖像分割、圖像分析和地面真實性的創(chuàng)建。
Deepmask——Facebook Research的Deepmask是Deepmask和SharpMask的Torch實現(xiàn)。
MultiPath——這是“用于對象檢測的MultiPath網(wǎng)絡(luò) ”中對象檢測網(wǎng)絡(luò)的Torch實現(xiàn)。
OpenCV——這是一個開源的計算機視覺庫，有超過2500個優(yōu)化算法。
MIScnn——是一個醫(yī)學(xué)圖像分割開源庫。它允許在幾行代碼中使用最先進的卷積神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)模型來建立管道。
Fritz——Fritz提供了幾種計算機視覺工具，包括用于移動設(shè)備的圖像分割工具。

　　總結(jié)

　　希望本文能為您提供一些圖像分割的背景知識，并為您提供一些工具和框架，以便您在工作中使用。

【免責(zé)聲明】本文僅代表作者本人觀點，與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立，不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考，并請自行承擔(dān)全部責(zé)任。

相關(guān)熱詞搜索：圖像分割

上一篇:2020年應(yīng)該關(guān)注的十大聯(lián)絡(luò)中心影響者

下一篇:微軟資深副總裁柯睿杰：創(chuàng)新力文化是增強經(jīng)濟復(fù)蘇力和企業(yè)韌性的秘訣

相關(guān)閱讀：

評論排行

推薦閱讀

專題

華為全聯(lián)接2020: 華為第五屆HUAWEI CONNECT大會在上海舉辦。[詳細]

2020中國呼叫中心...: 業(yè)界矚目的2020中國呼叫中心及企業(yè)通信大會將于7月9日在...[詳細]

語音技術(shù)行業(yè)現(xiàn)狀: 　　AI如此流行，從2019年開始一直延續(xù)到今年，我們在年...[詳細]

遠程辦公高效...: 抗擊疫情戰(zhàn)役進入攻堅階段，在家遠程辦公將成為近日工作...[詳細]

大家都在看

點擊排行
周排行
月排行

CTI論壇會員企業(yè)

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079677
傳真：+86-10-62041062
投稿：ctiforum@ctiforum.com
地址：北京市西城區(qū)新德街20號513室（100088）

網(wǎng)站首頁 | 公司簡介 | 聯(lián)系方式 | 工作機會 | 廣告服務(wù) | 會員服務(wù) | 服務(wù)項目 | 專家團隊 | 版權(quán)聲明 | 投稿方法

Copyright(C) 1999-2019 CTI論壇北京網(wǎng)際星河信息技術(shù)有限責(zé)任公司版權(quán)所有

電話：+86-10-82012787，+86-10-82079677 投稿：ctiforum@ctiforum.com

經(jīng)營性網(wǎng)站備案信息

京ICP證030771號

網(wǎng)絡(luò)110報警服務(wù)

京公網(wǎng)安備110102000104-1號