
技术摘要:
本发明提供一种图片聚类管理方法、系统、设备及介质,包括:获取与图片对应的特征向量;将特征向量与目标聚类类别中存储的目标信息进行相似度比较,其中,目标聚类类别只存储目标信息;目标信息包括以下至少之一:聚类中心、采样点;根据相似度比较结果,对目标聚类类 全部
背景技术:
近年来,随着公安信息化的不断发展,人脸识别的技术已经在公安领域得到了广 泛的应用。各省市利用大量布置的人脸抓拍机等设备获取了海量的人脸图片,并建立了人 脸数据库来存储这些人脸图片。但是,经发明人研究认为,目前的图片聚类存在以下问题: 基于人脸识别来进行归档的数据存在一定误识别的可能,基于这种误识别会产生错误的聚 类结果;传统的聚类方法无法达成增量实时的聚类,无法保证大数据量下的人脸聚类精度 以及人脸召回率,并且对识别引擎内存占用高,难以控制硬件上的成本。
技术实现要素:
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种图片聚类管理方法、 系统、设备及介质,用于解决现有技术中存在的问题。 为实现上述目的及其他相关目的,本发明提供一种图片聚类管理方法,包括有: 获取与图片对应的特征向量; 将所述特征向量与目标聚类类别中存储的目标信息进行相似度比较,其中,所述 目标聚类类别只存储目标信息;所述目标信息包括以下至少之一:聚类中心、采样点; 根据相似度比较结果,对所述目标聚类类别进行管理。 可选地,若所述相似度大于或等于预设值,则将所述特征向量聚类至所述目标聚 类类别中,并依据所述特征向量,更新或替换所述目标聚类类别的目标信息。 可选地,若所述相似度小于预设值,则创建一个聚类类别,并将所述特征向量聚类 至创建的聚类类别。 可选地,若所述相似度小于预设值,则创建一个聚类类别,并将所述特征向量聚类 至创建的聚类类别之后,还包括: 所述特征向量作为所述创建的聚类类别的目标信息。 可选地,在比较所述特征向量与所述目标聚类类别中目标信息的相似度前,还包 括: 获取所有图片的结构化特征信息; 基于所述结构化特征信息设置过滤规则,并按照所设置的过滤规则对获取的一张 或多张图片进行过滤。 可选地,所述特征向量包括以下至少之一:人脸特征向量、人体特征向量。 可选地,若所述特征向量为人脸特征向量,则获取所有图片的图片清晰度、人脸姿 态分数; 设置图片清晰度大于清晰度阈值、人脸姿态分数超过姿态分数阈值为过滤规则, 5 CN 111598012 A 说 明 书 2/20 页 并按照设置的过滤规则对获取的一张或多张图片进行过滤。 可选地,在比较所述人脸特征向量与所述目标聚类类别中目标信息的相似度前, 还包括: 获取满足过滤规则的一张或多张图片; 对满足过滤规则的每张图片中的人脸特征向量进行降维,将人脸特征向量的维度 由第一维度降低为第二维度。 可选地,若所述特征向量为人脸特征向量,则从已有聚类类别中确定所述目标聚 类类别的过程包括: 根据已有聚类类别中的聚类中心创建人脸检索索引; 基于所述人脸检索索引检索出与降维后的人脸特征向量最接近的前K个人脸; 根据最接近的前K个人脸所对应的聚类标签从已有聚类类别中定位出至多K个聚 类类别;并将所述已有的至多K个聚类类别确定为目标聚类类别。 可选地,计算降维后的人脸特征向量与已有聚类类别中人脸特征向量之间的距 离;若所述距离小于预设距离值,则将降维后的人脸特征向量与已有聚类类别中的人脸特 征向量确定为同一人脸的人脸特征向量,检索出与降维后的人脸特征向量最接近的人脸。 本发明还提供一种图片聚类管理系统,包括有: 获取模块,用于获取与图片对应的特征向量; 比较模块,用于将所述特征向量与目标聚类类别中存储的目标信息进行相似度比 较,其中,所述目标聚类类别只存储目标信息;所述目标信息包括以下至少之一:聚类中心、 采样点; 聚类模块,用于根据相似度比较结果,对所述目标聚类类别进行管理。 可选地,若所述相似度大于或等于预设值,则将所述特征向量聚类至所述目标聚 类类别中,并依据所述特征向量,更新或替换所述目标聚类类别的目标信息。 可选地,若所述相似度小于预设值,则创建一个聚类类别,并将所述特征向量聚类 至创建的聚类类别。 可选地,若所述相似度小于预设值,则创建一个聚类类别,并将所述特征向量聚类 至创建的聚类类别之后,还包括: 所述特征向量作为所述创建的聚类类别的目标信息。 可选地,在比较所述特征向量与所述目标聚类类别中目标信息的相似度前,还包 括: 获取所有图片的结构化特征信息; 基于所述结构化特征信息设置过滤规则,并按照所设置的过滤规则对获取的一张 或多张图片进行过滤。 可选地,所述特征向量包括以下至少之一:人脸特征向量、人体特征向量。 可选地,若所述特征向量为人脸特征向量,则获取所有图片的图片清晰度、人脸姿 态分数; 设置图片清晰度大于清晰度阈值、人脸姿态分数超过姿态分数阈值为过滤规则, 并按照设置的过滤规则对获取的一张或多张图片进行过滤。 可选地,在比较所述人脸特征向量与所述目标聚类类别中目标信息的相似度前, 6 CN 111598012 A 说 明 书 3/20 页 还包括: 获取满足过滤规则的一张或多张图片; 对满足过滤规则的每张图片中的人脸特征向量进行降维,将人脸特征向量的维度 由第一维度降低为第二维度。 可选地,若所述特征向量为人脸特征向量,则从已有聚类类别中确定所述目标聚 类类别的过程包括: 根据已有聚类类别中的聚类中心创建人脸检索索引; 基于所述人脸检索索引检索出与降维后的人脸特征向量最接近的前K个人脸; 根据最接近的前K个人脸所对应的聚类标签从已有聚类类别中定位出至多K个聚 类类别;并将所述已有的至多K个聚类类别确定为目标聚类类别。 可选地,计算降维后的人脸特征向量与已有聚类类别中人脸特征向量之间的距 离;若所述距离小于预设距离值,则将降维后的人脸特征向量与已有聚类类别中的人脸特 征向量确定为同一人脸的人脸特征向量,检索出与降维后的人脸特征向量最接近的人脸。 本发明还提供一种图片聚类管理设备,包括有: 获取与图片对应的特征向量; 将所述特征向量与目标聚类类别中存储的目标信息进行相似度比较,其中,所述 目标聚类类别只存储目标信息;所述目标信息包括以下至少之一:聚类中心、采样点; 根据相似度比较结果,对所述目标聚类类别进行管理。 本发明还提供一种设备,包括: 一个或多个处理器;和 其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时, 使得所述设备执行如上述中一个或多个所述的方法。 本发明还提供一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个 或多个处理器执行时,使得设备执行如上述中一个或多个所述的方法。 如上,本发明提供的一种图片聚类管理方法、系统、设备及介质,具有以下有益效 果: 通过获取与图片对应的特征向量;将特征向量与目标聚类类别中存储的目标信息 进行相似度比较,其中,目标聚类类别只存储目标信息;目标信息包括以下至少之一:聚类 中心、采样点;根据相似度比较结果,对目标聚类类别进行管理。本发明根据特征向量与目 标聚类类别中目标信息的相似度来进行图片聚类管理,不仅解决了传统图片聚类归档方法 中出现的误识别问题(本发明中的聚类中心和采样点均为特征向量;其中,聚类中心是目标 聚类类别中所有特征向量的平均值;采样点是在目标聚类类别中随机选择的特征向量);而 且相对于与全部聚类类别进行相似度比较而言,本发明只需要和已有聚类类比中的部分聚 类类别(即目标聚类类别)进行比较,能够加快比较速度,提高比较效率。同时,本发明还根 据相似度来将对应的特征向量加入至目标信息中进行更新或替换;或者将对应的特征向量 加入至新创建的目标信息中,让本发明能够实时增量聚类。并且本发明中的聚类类别中仅 保存聚类中心和目标信息,比传统的聚类归档方法占用的内存更低,使得本发明能够支持 单机亿级数据量的聚类任务。 7 CN 111598012 A 说 明 书 4/20 页 附图说明 图1为一实施例提供的图片聚类管理方法的流程示意图; 图2为另一实施例提供的图片聚类管理系统的硬件结构示意图; 图3为一实施例提供的终端设备的硬件结构示意图; 图4为另一实施例提供的终端设备的硬件结构示意图。 元件标号说明 M10 获取模块 M20 比较模块 M30 聚类模块 1100 输入设备 1101 第一处理器 1102 输出设备 1103 第一存储器 1104 通信总线 1200 处理组件 1201 第二处理器 1202 第二存储器 1203 通信组件 1204 电源组件 1205 多媒体组件 1206 语音组件 1207 输入/输出接口 1208 传感器组件