
技术摘要:
本发明公开了一种基于残差网络的聚类算法,利用深层次的残差网络Resnet50进行特征提取,将输入的高维数据映射到低维特征空间,在低维特征空间上进行K均值算法聚类从而得出分类标签,其中聚类网络利用神经网络框架中的可训练权值进行定义。同时在低维特征空间使用Softma 全部
背景技术:
图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开 来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区 域划归为若干个类别中的某一种,以代替人的视觉判读。特征空间的分类方法—首先将原 图像经过某种变换如K-L变换,小波变换等变换到特征空间,然后在特征空间提取图像的高 层特征以实现图像的分类。基于深度学习的图像分类,通常使用卷积神经网络对输入图像 进行特征提取,映射到新的特征空间,然后利用softmax等分类器进行分类。 无监督学习的特点是,模型学习的数据没有标签,因此无监督学习的目标是通过 对这些无标签样本的学习来揭示数据的内在特性及规律,其代表就是聚类。聚类算法是机 器学习中涉及对数据进行分组的一种算法。在理论上,相同的组的数据之间有相同的属性 或者是特征,不同组数据之间的属性或者特征相差就会比较大。K均值聚类算法是最常见的 聚类算法。k-均值聚类算法的核心思想是通过迭代把数据对象划分到不同的簇中,以求目 标函数最小化,从而使生成的簇尽可能地紧凑和独立。首先,随机选取k个对象作为初始的k 个簇的质心;然后,将其余对象根据其与各个簇质心的距离分配到最近的簇;再求新形成的 簇的质心。这个迭代重定位过程不断重复,直到目标函数最小化为止。 残差网络是由来自Microsoft Research的4位学者提出的卷积神经网络,在2015 年的ImageNet大规模视觉识别竞赛(中获得了图像分类和物体识别的优胜。残差网络的特 点是容易优化,并且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃 连接,缓解了在深度神经网络中增加深度带来的梯度消失问题。
技术实现要素:
本发明的目的在于克服现有技术的不足,提供一种基于残差网络的图像聚类方 法。 本发明是通过以下技术方案实现的: 一种基于残差网络的图像聚类方法,包括以下步骤: 步骤一:对图像数据集进行数据处理; 步骤二:搭建基于残差模块的卷积神经网络Resnet50,并导入基于ImageNet数据 集预训练的权重,根据输入尺寸配置输入层,输入层的输出作为Resnet50的输入,之后用展 开层展平Resnet50的输出特征向量,再通过连接全连接层调整特征向量的维度,最后连接 一层Softmax作为分类器; 步骤三:定义一种基于Keras中Layer类的聚类层,将步骤二的卷积神经网络中分 类器的输入也作为聚类层的输入,以聚类层产生的聚类结果作为分类器的参考标签,对新 的整个神经网络进行训练; 3 CN 111598119 A 说 明 书 2/3 页 步骤四:结束训练后,利用该神经网络对图像数据集进行分类。 在上述技术方案中,神经网络进行训练过程中,其中聚类层的更新依据K均值聚类 算法中各个向量与均值之间的方差作为损失函数,使得各个类中的特征向量与各个类质心 之间的方差和最小;分类器模块的更新,通过分类器产生的标签和聚类层产生的标签之间 的交叉熵作为损失函数进行梯度下降更新。 在上述技术方案中,步骤三中,将Keras中的可训练权重设置为与分类类别数量相 同的聚类中心,采用统计学中的T分布,根据特征向量与聚类中心之间的距离进行属于各类 概率的计算,进行归一化处理,输出一个维度与分类种类相同的向量,向量中各个值对应着 属于各类的概率,总和为1。 本发明的优点和有益效果为: 本发明提出的一种基于残差网络的聚类算法,利用深层次的残差网络Resnet50进 行特征提取,将输入的高维数据映射到低维特征空间,在低维特征空间上进行K均值算法聚 类从而得出分类标签,其中聚类网络利用神经网络框架中的可训练权值进行定义。同时在 低维特征空间使用Softmax分类器进行分类,以聚类产生的标签作为参考标签,进行训练。 相较于传统的聚类算法,本发明大大提升了无监督学习的准确度,在没有任何先验知识的 支撑下,仅仅对图像数据本身的训练,可以达到较好的效果,避免了图像分类任务中难度较 大成本较高的标注难题。 附图说明 图1是本发明的整个神经网络的结构示意图。 图2是步骤二中构建的卷积神经网络的结构示意图。 图3是步骤二的卷积神经网络中分类器的输入作为该聚类层的输入的结构示意 图。 对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据以上附 图获得其他的相关附图。