4 个月前

SegNet:一种用于图像分割的深度卷积编码器-解码器架构

SegNet:一种用于图像分割的深度卷积编码器-解码器架构

摘要

我们提出了一种新颖且实用的深度全卷积神经网络架构,用于语义像素级分割,称为SegNet。该核心可训练分割引擎由一个编码器网络、一个相应的解码器网络以及一个像素级分类层组成。编码器网络的架构在拓扑上与VGG16网络中的13个卷积层完全相同。解码器网络的作用是将低分辨率的编码器特征图映射到全输入分辨率的特征图,以实现像素级分类。SegNet的新颖之处在于解码器如何对其低分辨率输入特征图进行上采样。具体而言,解码器利用对应编码器在最大池化步骤中计算出的池化索引进行非线性上采样。这消除了学习上采样的需要。上采样的特征图是稀疏的,然后通过可训练滤波器进行卷积以生成密集的特征图。我们将提出的架构与广泛采用的全卷积网络(FCN)以及知名的DeepLab-LargeFOV和DeconvNet架构进行了比较。这一比较揭示了在实现良好分割性能时所涉及的记忆与精度之间的权衡。SegNet主要受到场景理解应用的驱动,因此在推理过程中设计为高效利用内存和计算时间。与其他竞争架构相比,其可训练参数的数量也显著较少。我们还在道路场景和SUN RGB-D室内场景分割任务中对SegNet和其他架构进行了控制基准测试。结果显示,SegNet在提供良好性能的同时,具有竞争力的推理时间和更高效的内存使用。此外,我们还提供了SegNet的Caffe实现和在线演示(http://mi.eng.cam.ac.uk/projects/segnet/)。

代码仓库

neuropoly/multiclass-segmentation
pytorch
GitHub 中提及
alejandrodebus/SegNet
pytorch
GitHub 中提及
akhadangi/EM-net
GitHub 中提及
yinanzhu12/SegNet-keras
GitHub 中提及
trypag/pytorch-unet-segnet
pytorch
GitHub 中提及
PRBonn/bonnet
tf
GitHub 中提及
yubaoliu/caffe-segnet
GitHub 中提及
shanglianlm0525/CvPytorch
pytorch
GitHub 中提及
Harsharma2308/PoseRefinement
pytorch
GitHub 中提及
s9mondal9upriti/Segnet
pytorch
GitHub 中提及
HAN-ARK/GVSS-S.A.Drone
GitHub 中提及
JosephPB/XNet
GitHub 中提及
alexgkendall/SegNet-Tutorial
caffe2
GitHub 中提及
Fangrn/caffe-segnet
GitHub 中提及
pa56/SegNetonCityscapes
GitHub 中提及
vinceecws/SegNet_PyTorch
pytorch
GitHub 中提及
azy64/Deep-Learning
tf
GitHub 中提及
y-ouali/pytorch_segmentation
pytorch
GitHub 中提及
Paultool/segnet
GitHub 中提及
osmr/imgclsmob
mxnet
GitHub 中提及
TheUser0815/segnet-pytorch
pytorch
GitHub 中提及
rotemgoren/segNet
pytorch
GitHub 中提及
TqDavid/td
GitHub 中提及
mrmtn86/python1
caffe2
GitHub 中提及
hydrogo/rainnet
GitHub 中提及
CellSMB/EM-net
GitHub 中提及
arsalhuda24/SS_lstm
tf
GitHub 中提及
navganti/SIVO
GitHub 中提及
navganti/SegNet
caffe2
GitHub 中提及
alexandrelewin/FollowMe
tf
GitHub 中提及
jqueguiner/camembert-as-a-service
pytorch
GitHub 中提及
ajjdan/KaI
tf
GitHub 中提及
ArkaJU/SegNet---Chromosome
tf
GitHub 中提及
vqdang/xy_net
tf
GitHub 中提及
preddy5/segnet
GitHub 中提及
yubaoliu/rds-slam
GitHub 中提及
vqdang/hover_net
tf
GitHub 中提及

基准测试

基准方法指标
crowd-counting-on-ucf-qnrfEncoder-Decoder
MAE: 270
lesion-segmentation-on-anatomical-tracings-ofSegNet
Dice: 0.2767
IoU: 0.1911
Precision: 0.3938
Recall: 0.2532
lesion-segmentation-on-university-of-waterlooSegNet
Dice score: 0.854 ±0.088
medical-image-segmentation-on-riteSegNet
Dice: 52.23
Jaccard Index: 39.14
real-time-semantic-segmentation-on-camvidSegNet
Frame (fps): 4.6
Time (ms): 217
mIoU: 46.4%
scene-segmentation-on-sun-rgbdSegNet
Mean IoU: 31.84
semantic-segmentation-on-ade20kSegNet
Validation mIoU: 21.64
semantic-segmentation-on-camvidSegNet
Mean IoU: 46.4%
semantic-segmentation-on-cityscapesSegNet
Mean IoU (class): 57.0%
semantic-segmentation-on-skyscapes-dense-1SegNet
Mean IoU: 23.14
semantic-segmentation-on-tlcgisSegNet
IoU: 77.80
thermal-image-segmentation-on-mfn-datasetSegNet
mIOU: 42.3

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
SegNet:一种用于图像分割的深度卷积编码器-解码器架构 | 论文 | HyperAI超神经