用于街景语义分割的全分辨率残差网络
资料介绍:
用于街景语义分割的全分辨率残差网络(中文10000字 ,英文PDF)
摘要
语义图像分割是现代自主驾驶系统的重要组成部分,对周围场景的准确理解对导航和行动规划至关重要。目前最先进的语义图像分割方法依赖于预先训练的网络,这些网络最初是为对图像进行整体分类而开发的。而这些网络表现出卓越的识别性能(即,它们缺乏定位精度(即,什么东西究竟在什么地方?因此,为了在全图像分辨率下获得像素精确的分割掩码,必须执行额外的处理步骤。为了解决这一问题,我们提出了一种新的类resnet架构,它具有很强的本地化和识别性能。我们在网络中使用两个处理流,将多尺度上下文与像素级精度结合起来: 一个流以完整的图像分辨率携带信息,能够精确地遵守段边界。另一个流经过一系列池操作,以获得用于识别的健壮特性。这两个流是耦合在完整的图像分辨率使用残差。没有额外的处理步骤,也没有预先培训,我们的方法在Cityscapes数据集上获得了71.8%的相交比联合得分。 [资料来源:http://Doc163.com]
[资料来源:http://www.doc163.com]