语义分割网络
语义分割是对图像在像素级别上进行分类的方法,在一张图像中,属于同一类的像素点都要被预测为相同的类。因此语义分割是从像素级别来理解图像。
注意,语义分割仅仅是把某一类划分出来,而针对每个个体没办法进行分割(实例分割)。
常见的语义分割网络有很多,如FCN、U-Net、SegNet、DeepLab等。
FCN
FCN(Fully Convolutional Networks)属于利用深度网络进行图片语义分割的开山之作,其主要思想为:
对于一般的CNN网络分类图像,如VGG和ResNet,在网络的最后是通过全连接层,通过softmax进行分类,但这只能表示整个图片的类别。FCN把最后几个全连接层都换成了卷积操作,得到和输入图像尺寸相当的特征映射,最后通过softmax获取每个像素点的分类信息,实现像素点的图像分割。
端到端像素级语义分割任务,需要输出分类结果尺寸和输入图像尺寸一致,面对池化造成的图面尺寸缩小,FCN采用反卷积(deconvolution)进行上采样,从而保证图像大小的一致。
为了更有效的利用特征映射的信息,FCN提出一种跨层连接结构,将低层和高层的目标位置信 ...





