
技术摘要:
本发明涉及基于卷积神经网络的遥感正射影像密集建筑物提取方法,具体包括以下步骤:S1:制作训练样本:获取原始建筑物遥感影像,并标注,然后进行数据增强;S2:建立改进的Mask‑RCNN模型:在Mask‑RCNN原有的基础特征提取网络后设有一个由底到上的特征增强结构,从特 全部
背景技术:
高分辨率遥感影像中建筑物的自动化提取对数字地图的制作和更新、城市变化检 测、违规建筑检测以及智慧城市的建设等具有极其重要的作用。目前常用的建筑物识别和 提取的方法分为两类:传统的机器学习方法和深度学习方法。传统的机器学习通过人工设 计特征来实现对建筑物的表达,从而实现建筑物的识别与提取,通常设计的建筑物特征包 括:长度、面积、形状、高度以及一些纹理特征等,这种方法主要是基于经验来设计特征,并 且设计的特征会由于外部环境的变化而有所改变,所以这种方法提取的精度都不是很高。 2006年深度学习的提出,极大地促进了机器学习的发展,相较于传统的机器学习人工提取 特征的方式,深度学习采用的是神经网络自动提取特征。其中在图像识别上卷积神经网络 (Convolutional Neural Network,CNN)应用最为广泛,2015年卷积神经网络开始被引入遥 感领域中,在遥感影像分类、图像检索,对象识别等方面凸显巨大的优势。遥感影像的建筑 物提取属于计算机视觉任务,但是相较于其他的计算机视觉任务较为复杂,它不仅牵涉了 计算机视觉里面的图像分类和语义分割问题,还是一个目标检测和实例分割问题。目前大 部分学者使用的是图像的语义分割来实现建筑物的提取,但是显然这并不能满足实际生产 的需要,在实际生产中我们往往关注的是建筑物本身属性,比如建筑物的数量和建筑物的 位置等。因此,如何以实例分割方法来实现建筑物的提取成为目前亟待研究的问题。 目前最流行的深度学习实例分割框架是Mask-RCNN,但是将Mask-RCNN直接用于遥 感影像建筑物识别精度并不是很高,主要原因有两点:1.遥感影像本身具有多方向性的特 点,遥感数据集多为俯拍,目标的方向都是不确定的。2.遥感影像拍摄的高度不一,几百米 到几万米均有,这时地面的同类目标可能大小不一;就地面建筑物来说,建筑物的形状大小 本身就存在大小不一的情况,现有的Mask-RCNN模型并不能检测出所有房屋,比如对小型房 屋提取的效果较好,对于大型建筑物提取的效果并不是很好。
技术实现要素:
为了克服现有技术的上述不足,本发明提出了基于卷积神经网络的遥感正射影像 密集建筑物提取方法,解决现有遥感影像建筑物识别精度不高,无法克服遥感影像方向多 样性、尺度多样性带来识别误差的技术问题。 本发明是通过以下技术方案实现的: 基于卷积神经网络的遥感正射影像密集建筑物提取方法,具体包括以下步骤: S1:制作训练样本:获取原始建筑物遥感影像,并通过VIA数据标记工具进行标注, 然后进行数据增强; S2:建立改进的Mask-RCNN模型:所述改进的Mask-RCNN模型包括Mask-RCNN原有的 3 CN 111553303 A 说 明 书 2/4 页 基础特征提取网络,所述基础特征提取网络后设有一个由底到上的特征增强结构,从特征 增强结构输出的特征经区域建议网络RPN输入到池化层,对池化后每一层级特征进行融合, 特征融合后连接旋转不变全连接层,最后进行Mask-RCNN分类、边框定位和mask回归,实现 对遥感影像中建筑物的提取; S3:模型训练、微调:将S1中制作好的训练样本输入改进的Mask-RCNN模型中进行 训练,并微调模型超参数,当损失函数收敛或近似收敛时,停止训练,得到训练的最优模型; S4:模型测试:将待测遥感影像数据输入训练好的最优模型中进行测试,并分析建 筑物提取结果,统计提取精度。 进一步的,S1中对数据进行标注之前先剪裁。 进一步的,S1中数据增强的方式为随机90°倍数旋转、水平翻转和伸缩变换。 进一步的,S2中采用的Mask-RCNN基础特征提取网络有特征提取主干网络和主干 网络的扩展网络,Mask-RCNN特征提取主干网络为深度残差网络,主干网络的扩展网络为特 征金字塔网络FPN。 进一步的,S3中模型超参数包括迭代次数、学习率。 进一步的,S4中模型测试时,先裁剪为小块进行测试,之后再拼接。 进一步的,S4中测试前,观察在训练集和验证集上的精度曲线来分析模型是否存 在过拟合和欠拟合的情况,如若不存在过拟合和欠拟合则可进行后续的测试。 与现有技术相比,本发明的有益效果在于: (1)本发明提出的基于卷积神经网络的遥感正射影像密集建筑物提取方法,通过 在制作训练样本的时候对原始遥感影像进行数据增强,并在原有Mask-RCNN分类层前面加 一个旋转不变层,很好的解决遥感影像方向多样性的技术问题; (2)在原有Mask-RCNN基础特征提取网络后增设一个由底到上的特征增强结构进 行底层特征增强,增强低层特征的信息传播能力,并对池化后的每一层级特征进行融合,利 用融合后的特征进行预测,解决了遥感影像尺度多样性的技术问题; 综上,本申请提出的基于卷积神经网络的遥感正射影像密集建筑物提取方法,自 动化程度高,节省了大量的人力物力;建筑物识别精度高,克服遥感影像因方向多样性、尺 度多样性产生的识别误差。 附图说明 图1为现有Mask-RCNN网络的工作流程图; 图2为本发明实施例所述基于卷积神经网络的遥感正射影像密集建筑物提取方法 的流程示意图; 图3为本发明实施例所述特征增强结构示意图; 图4为本发明实施例所述特征融合示意图; 图5为本发明实施例所述改进的Mask-RCNN网络的工作流程图; 图6(a)本发明实施例所述待测遥感影像; 图6(b)为图6(a)的建筑物识别结果; 图6(c)为图6(a)的建筑物提取结果。 4 CN 111553303 A 说 明 书 3/4 页