
技术摘要:
本发明涉及一种基于多特征融合的高分辨率遥感影像城市功能分区方法,包括:步骤1、图像预处理;步骤2、将各图像中的特征值分配至与其最相近的视觉单词,统计各个视觉词汇的相应词频,形成视觉词汇特征;构建多特征BoW视觉字典;步骤3、构建LDA概率主题模型,利用LDA概 全部
背景技术:
随着遥感技术的发展,遥感图像的时间、空间分辨率的不断提高,遥感图像的数据 量急剧增加。在面对海量的遥感数据的情况下,利用人工目视解译的方法对遥感图像解译 需要花费大量的时间和人力。因此,如何利用计算机自动地把遥感图像进行解译成为了遥 感领域的热点研究问题。同时,新常态时期的中国经济和城市进入新的发展阶段,传统的城 市发展模式面临诸多问题,对城市规划理念、策略和建设提出新的要求和挑战。为了加强城 市功能区的合理规划,确定最合理的城市功能区空间布局,在提高城市土地利用效率的基 础上,将城市各项产业集聚起来并发挥最大效能,在一定程度上提高城市土地利用效率,确 保新型城镇战略的有效实施。 为了克服遥感图像低层视觉特征与高层语义之间的鸿沟,基于中层特征对土地利 用场景语义建模描述的方法逐渐得到广泛的关注。尤其是近年来的词袋模型(Bag of Words model)在图像分析和图像分类的应用中取得了巨大成功,成为一种新的、有效的图 像内容表达的研究思路,并在遥感图像土地利用场景分类中取得了一定成果。它将图像表 示为一些局部图像块,每幅图像块像句子一样表示为不同比例的单词,所有单词的集合组 成一个视觉词典。 词袋模型具有计算简单,对噪声、光照和局部遮挡更加鲁棒等特点。但是由于遥感 图像纹理信息丰富,局部特征点较多,直接采用基于聚类方法获得视觉单词不一定能反映 场景特征,从而造成了总体分类精度也不高。而对于高分辨率遥感图像中的不同建筑物类 型,各个特征的表现并不一致。如有些类可能由于其光谱特征的显著性,所以最适合采用光 谱特征来进行分类,而有些类纹理比较丰富,使得局部特征比较明显。并且仅仅使用遥感影 像进行城市功能分区时,会出现“同物异谱”、“同谱异物”的情况,导致分类精度的降低。显 然如果采用同一种特征对不同类别地物进行分类的方法不再适用。 综上所述,提出一种基于多特征融合的高分辨率遥感影像城市功能分区方法,就 显得尤为重要。
技术实现要素:
本发明的目的是克服现有技术中的不足,提供一种基于多特征融合的高分辨率遥 感影像城市功能分区方法,具体包括如下步骤: 步骤1、图像预处理,并用合适的格网将图像分割,选取训练集和测试集;计算落入 每个格网的POI类型数量比例,得到POI特征;分别提取遥感图像训练集中的局部特征、光谱 特征、纹理特征、地表温度特征和三维空间特征: 3 CN 111582146 A 说 明 书 2/7 页 步骤1.1、提取遥感图像局部特征:选用SURF算法,采用Hessian矩阵行列式近似值 图像,求出每一个像素点(x,y)对应的Hessian矩阵: 上式中,(x,y)为像素点坐标,f(x,y)为该坐标点的灰度值; 当Hessian矩阵的判别式取得局部极大值时,判定当前点是比周围邻域内其他点 更亮的点或更暗的点,定位关键点的位置;Hessian矩阵的判别式为: 使用添加了渐变信息的盒子滤波模板对积分图像进行盒子滤波计算,构建尺度空 间;每个像素点的det(H)和相邻尺度空间的所有相邻点的det(H)进行比较,当其大于或小 于所有相邻点时,该点就是极值点,并记下极值点的位置作为特征点; 在以特征点为圆心,6s为半径的圆形区域中,构建一个60度的扇形滑动窗口;所述 s为特征点的尺度空间;以0.2的弧度进行旋转遍历整个圆形区域,并计算扇形滑动窗口内 的Haar小波特征值;选择Haar小波特征值总和最大的方向作为该特征点的主方向;Haar小 波特征总和的求法是对图像Harr小波特征值dx和dy进行累加,得到一个矢量(mω,θω): mω=∑ωdx ∑ωdy (3) θω=arctan(∑ωdx/∑ωdy) (4) 主方向θ为图像最大Harr小波特征值所对应的方向,即: θ=θω|max{mω} (5) 在特征点处取一个带有θ方向的正方形框,框的边长为20s,所述s为特征点的尺度 空间;将带有θ方向的正方形框分为4×4个子区域,统计每个子区域的Harr小波特征值的水 平方向值之和、水平方向绝对值之和、垂直方向之和及垂直方向绝对值之和;所述SURF特征 描述子共由4×4×4=64维特征矢量组成; 步骤1.2、提取遥感图像光谱特征,计算每一个波段的均值与标准差,实现方式如 下: 上式(6)和式(7)中,n为格网中总像元数量,vi为在波段中第i个像元的灰度值; 步骤1.3、提取遥感图像纹理特征,选用LBP算子,将LBP算子定义在3×3像素的窗 口内: 上式中,(xc,yc)表示每个3×3区域的中心点,p表示3×3窗口中除中心像素点外的 第p个像素点;I(c)表示中心像素点的灰度值,I(p)表示领域内第p个像素点的灰度值; 以窗口中心像素为阈值,将中心像素值与相邻的8个像素的灰度值比较:若相邻的 像素值大于中心像素值,则该位置被标记为1;否则标记为0: 4 CN 111582146 A 说 明 书 3/7 页 上式中,x为中心像素值;得到一个8位二进制数,将这个8位二进制数作为窗口中 心像素点的LBP值,来反应这个3×3像素窗口的纹理信息; 步骤1.4、提取地表温度特征,根据NDVI计算地表比射率: 上式中,ε为地表比辐射率;NDVI为归一化植被指数;根据单窗算法计算地表温度, 其公式如下: Ts={a·(1-C-D)[b·(1-C-D) C D]·T-D·Ta}/C (11) 上式中,Ts为地表温度;a和b为经验系数,其中a=-67.35535,b=0.458608;T为亮 度温度;Ta为大气平均作用温度;C和D的计算公式如下: C=τ·ε (12) D=(1-τ)·[1 τ·(1-ε)] (13) 上式(12)至式(13)中,τ为大气透过率,ε为地表比辐射率; 步骤1.5、提取三维空间特征:通过LiDAR技术获得三维空间点云数据,再利用克里 金空间插值算法生成数字地表模型DSM特征; 步骤2、将各图像中的特征值分配至与其最相近的视觉单词,统计各个视觉词汇的 相应词频,形成视觉词汇特征;构建多特征BoW视觉字典: 步骤2.1、构建各类特征词汇表:分别对步骤1中提取的局部特征、光谱特征、纹理 特征、地表温度特征和三维空间特征进行K均值聚类;每一个聚类中心即为一个单词,所有 的聚类中心汇聚成一个单词表; 步骤2.2、通过计算每个格网的特征与各单词的距离,将该特征分配给单词表中距 离最近的单词; 步骤2.3、统计各个单词对应的词频生成一个K维的特征向量,再用堆栈的方式将 各K维的特征向量拼接,将每个格网用一个多维向量来表示: fi={suri,spei,lbpi,lsti,dsmi,poii} (14) 上式中,suri为局部特征向量,spei为光谱特征向量,lbpi为纹理特征向量,lsti为 地表温度特征向量,dsmi为三维空间特征向量,poii为POI特征向量 将每个格网当作文档用特征词汇描述: Doci={wordsur,wordspe,wordlbp,wordlst,worddsm,wordpoi}i (15) 步骤3、构建LDA概率主题模型,利用LDA概率主题模型挖掘图像的高维语义向量, LDA概率主题模型通过提取各特征向量所包含的高维语义向量来分配各特征向量的概率: 步骤3.1、利用LDA概率主题模型将文档集中的每篇文档按照概率分布的形式给 出: P(w|d)=P(w|t)×P(t|d) (16) 上式中,w为词,d为文档,t为主题;以主题t为中间层,通过两个向量 分别给 出P(w|t)和P(t|d),θd表示对每个总集合D中的个体文档d对应到不同个体主题t的概率, 5 CN 111582146 A 说 明 书 4/7 页 表示对每个总集合T中的个体主题t生成不同单词的概率向量; 步骤3.2、LDA概率主题模型的学习过程为: 对所有的d和t,先随机地给θd , 赋值;针对特定的文档ds中的第i个单词wi,如果 单词wi对应的主题为tj,将公式(15)改写为: Pj(wi|ds)=P(wi|tj)×P(tj|ds) (17) 枚举总集合T中的主题t,得到所有的Pj(wi|ds);根据Pj(wi|ds)的结果为ds中的第i 个单词wi选择一个主题t,所述wi对应的主题t取Pj(wi|ds)概率最大的主题tj; 将一次迭代过程定为:对文档总集合D中的所有文档d中的所有w进行一次P(w|d) 计算,并重新选择主题; 重复迭代过程直到θd , 收敛,最后输出估计参数θd , 得到每个单词的主题以 及每个主题的高维语义向量; 步骤4、根据步骤3得到的高维语义向量,训练SVM分类器; 步骤5、用SVM分类器对测试集进行城市功能分区。 作为优选,所述步骤1中POI特征用于对POI数据根据地名信息进行重分类。 作为优选,所述步骤1.1中SURF算法通过保持图像大小不变,改变盒子滤波器的大 小来构建尺度金字塔。 作为优选,所述步骤1.4中以卫星遥感数据反演方式提取地表温度特征。 作为优选,步骤1.1所述SURF特征描述子具有尺度和旋转不变性,对光照的变化也 具有不变性。 作为优选,所述步骤3中LDA概率主题模型为一种无监督的贝叶斯模型。 本发明的有益效果是:本发明引入了POI数据降低了遥感数据因同物异谱和同谱 异物导致的误分;本发明综合利用图像的多种特征,包括局部特征、光谱特征、纹理特征、地 表温度特征、空间三维特征和POI特征,能够在图像单一特征不明显的情况得到更高的分类 精度。 附图说明 图1为本发明的技术流程图。