图像分割任务里,像素级分类一直是硬骨头。传统方法靠手工特征,遇到复杂场景就抓瞎。

这篇工作把全卷积网络(FCN)往深了做,堆了几十层卷积。深层网络能抓多尺度特征,小物体和大背景都能照顾到。

打开网易新闻 查看精彩图片

关键改动在两点:一是用空洞卷积(dilated convolution)扩大感受野,不丢分辨率;二是砍掉全连接层,全程卷积保空间信息。

实验在PASCAL VOC和Cityscapes上跑,mIoU比当时主流方法高出5-8个点。推理速度也没崩,单卡能实时处理高清图。

打开网易新闻 查看精彩图片

这思路后来成了语义分割基线。现在看,"全卷积+超深网络"的配方依然能打。