logo好方法网

一种目标对象聚类方法及装置


技术摘要:
本申请涉及图像处理技术领域,尤其涉及一种目标对象聚类方法及装置,所述方法包括:获取监控视频,从所述监控视频的图像中截取包括目标对象信息的子图像并记录每个子图像的帧号;然后,提取每个子图像的特征向量,并基于提取出的每个子图像的特征向量,将包括相同目标  全部
背景技术:
在视频监控、安防、无人驾驶等应用领域中,一般会涉及到对监控视频中的目标对 象进行检测,目标对象例如为监控视频中出现的行人、或车辆等。具体的,在一些特定应用 场景下,例如,确定目标对象在监控视频所监控的区域内的活动情况时,需要从监控视频中 筛选出所有出现有目标对象的图像,这就涉及到对监控视频中出现有目标对象的图像进行 聚类。 现有技术中,常用的聚类算法主要为K-means和KD-tree等,但是这类聚类算法往 往首先要确定出一个类别阈值,以便确定出需要将目标对象需要聚为几类,但是在对监控 视频中的目标对象进行聚类时,往往很难确定出需要将目标对象聚为多少类,因此,这种类 别阈值的选取可能会出现较大误差,进而导致聚类准确率较低。
技术实现要素:
有鉴于此,本申请实施例提供一种目标对象聚类方法及装置,以提升目标对象检 测过程中的聚类的准确率。 主要包括以下几个方面: 第一方面,本申请实施例提供了一种目标对象聚类方法,包括: 获取监控视频,从所述监控视频的图像中截取包括目标对象信息的子图像并记录 每个子图像的帧号; 提取每个子图像的特征向量,并基于提取出的每个子图像的特征向量,将包括相 同目标对象信息的子图像划分在同一类别集合中; 基于划分的各类别集合中包括的子图像的帧号,确定待调整的类别集合,并调整 所述待调整的类别集合中包括的子图像。 一种可能的实施方式中,所述基于提取出的每个子图像的特征向量,将包括相同 目标对象信息的子图像划分在同一类别集合中,包括: 针对待聚类的第i个子图像,将所述第i个子图像划分至第k个类别集合中;i,k为 正整数; 从除所述第i个子图像之外的待聚类的子图像中,选择符合所述第k个类别集合的 聚类条件的子图像并划分至所述第k个类别集合中。 一种可能的实施方式中,所述从除所述第i个子图像之外的待聚类的子图像中,选 择符合所述第k个类别集合的聚类条件的子图像并划分至所述第k个类别集合中,包括: 从除所述第i个子图像之外的待聚类的子图像中依次选取子图像,执行第一聚类 过程,直至遍历完待聚类的全部子图像;其中,所述第一聚类过程包括: 5 CN 111597980 A 说 明 书 2/16 页 计算选取的子图像的特征向量与所述第i个子图像的特征向量之间的第一特征相 似度; 当确定选取的第j个子图像对应的第一特征相似度大于第一设定阈值时,将所述 第j个子图像划分至所述第k个类别集合中; 将在第j个子图像之后选取的子图像作为剩余子图像,计算每个剩余子图像的特 征向量与所述第k个类别集合中任一个子图像的特征向量之间的第二特征相似度; 基于每个剩余子图像对应的第二特征相似度,将对应的第二特征相似度大于所述 第一设定阈值的剩余子图像划分至所述第k个类别集合。 一种可能的实施方式中,所述基于提取出的每个子图像的特征向量,将包括相同 目标对象信息的子图像划分在同一类别集合中,包括: 在截取出的子图像中依次选取待聚类的子图像,以选取的子图像作为聚类中心, 执行第二聚类过程,直至遍历完待聚类的全部子图像;其中,所述第二聚类过程包括: 计算所述选取的子图像的特征向量与除所述选取的子图像之外的每个待聚类的 子图像的特征向量之间的第三特征相似度; 基于每个待聚类的子图像对应的第三特征相似度,筛选出对应的第三特征相似度 大于第一设定阈值的待聚类的子图像; 将所述选取的子图像、以及所述对应的第三特征相似度大于第一设定阈值的待聚 类的子图像划分至同一类别集合中。 一种可能的实施方式中,所述基于划分的各类别集合中包括的子图像的帧号,确 定待调整的类别集合,包括: 确定划分的各类别集合中子图像的最大帧号以及最小帧号; 检测划分的各类别集合分别对应的最大帧号和最小帧号之间的中间帧号是否连 续; 将中间帧号不连续的类别集合确定为待调整的类别集合。 一种可能的实施方式中,调整所述待调整的类别集合中包括的子图像,包括: 针对第n个待调整的类别集合,确定所述第n个待调整的类别集合中缺失的中间帧 号; 确定除所述第n个待调整的类别集合之外的其它类别集合中与所述缺失的中间帧 号匹配的第一候选子图像;以及,确定所述第n个待调整的类别集合中与所述缺失的中间帧 号相邻的帧号匹配的第一参考子图像; 计算所述第一参考子图像的特征向量与每个第一候选子图像的特征向量之间的 第四特征相似度; 基于每个第一参考子图像对应的第四特征相似度,筛选出对应的第四特征相似度 大于第二设定阈值的第一候选子图像; 将筛选出的第一候选子图像划分至所述第n个待调整的类别集合中。 一种可能的实施方式中,确定除所述第n个待调整的类别集合之外的其它类别集 合中与所述缺失的中间帧号匹配的第一候选子图像,包括: 从所述其它类别集合中筛选出子图像的帧号为所述缺失的中间帧号的第一候选 类别集合; 6 CN 111597980 A 说 明 书 3/16 页 确定所述第一候选类别集合中包括的帧号为所述缺失的中间帧号的第一候选子 图像。 一种可能的实施方式中,基于划分的各类别集合中包括的子图像的帧号,确定待 调整的类别集合,包括: 针对划分的第n个类别集合,确定第n个类别集合中子图像的最大帧号、以及与所 述最大帧号匹配的第二参考子图像; 确定除所述第n个类别集合之外的其它类别集合中与所述最大帧号的下一帧号匹 配的第二候选子图像; 计算所述第二参考子图像的特征向量与每个第二候选子图像的特征向量之间的 第四特征相似度; 当存在所述第四特征相似度大于第二设定阈值的第二候选子图像时,将所述第四 特征相似度大于第二设定阈值的第二候选子图像所在的第二候选类别集合、以及所述第n 个类别集合,确定为待调整的类别集合。 一种可能的实施方式中,所述调整所述待调整的类别集合中包括的子图像,包括: 将所述第二候选类别集合中包括的所述第四特征相似度大于所述第二设定阈值 的第二候选子图像划分至所述第n个类别集合中。 一种可能的实施方式中,基于划分的各类别集合中包括的子图像的帧号,确定待 调整的类别集合,包括: 针对划分的第n个类别集合,确定第n个类别集合中子图像的最小帧号、以及与所 述最小帧号匹配的第三参考子图像; 确定除所述第n个类别集合之外的其它类别集合中与所述最小帧号的上一帧号匹 配的第三候选子图像; 计算所述第三参考子图像的特征向量与每个第三候选子图像的特征向量之间的 第四特征相似度; 当存在所述第四特征相似度大于第二设定阈值的第三候选子图像时,将所述第四 特征相似度大于第二设定阈值的第三候选子图像所在的第三候选类别集合、以及所述第n 个类别集合,确定为待调整的类别集合。 一种可能的实施方式中,所述调整所述待调整的类别集合中包括的子图像,包括: 将所述第三候选类别集合中包括的所述第四特征相似度大于所述第二设定阈值 的第三候选子图像划分至所述第n个类别集合中。 第二方面,本申请实施例提供了一种目标对象聚类装置,包括: 获取模块,用于获取监控视频,从所述监控视频的图像中截取包括目标对象信息 的子图像并记录每个子图像的帧号; 划分模块,用于提取每个子图像的特征向量,并基于提取出的每个子图像的特征 向量,将包括相同目标对象信息的子图像划分在同一类别集合中; 调整模块,用于基于划分的各类别集合中包括的子图像的帧号,确定待调整的类 别集合,并调整所述待调整的类别集合中包括的子图像。 一种可能的设计中,所述划分模块,在基于提取出的每个子图像的特征向量,将包 括相同目标对象信息的子图像划分在同一类别集合中时,具体用于: 7 CN 111597980 A 说 明 书 4/16 页 针对待聚类的第i个子图像,将所述第i个子图像划分至第k个类别集合中;i,k为 正整数; 从除所述第i个子图像之外的待聚类的子图像中,选择符合所述第k个类别集合的 聚类条件的子图像并划分至所述第k个类别集合中。 一种可能的设计中,所述划分模块,在从除所述第i个子图像之外的待聚类的子图 像中,选择符合所述第k个类别集合的聚类条件的子图像并划分至所述第k个类别集合中 时,具体用于: 从除所述第i个子图像之外的待聚类的子图像中依次选取子图像,执行第一聚类 过程,直至遍历完待聚类的全部子图像;其中,所述第一聚类过程包括: 计算选取的子图像的特征向量与所述第i个子图像的特征向量之间的第一特征相 似度; 当确定选取的第j个子图像对应的第一特征相似度大于第一设定阈值时,将所述 第j个子图像划分至所述第k个类别集合中; 将在第j个子图像之后选取的子图像作为剩余子图像,计算每个剩余子图像的特 征向量与所述第k个类别集合中任一个子图像的特征向量之间的第二特征相似度; 基于每个剩余子图像对应的第二特征相似度,将对应的第二特征相似度大于所述 第一设定阈值的剩余子图像划分至所述第k个类别集合。 一种可能的设计中,所述划分模块,在基于提取出的每个子图像的特征向量,将包 括相同目标对象信息的子图像划分在同一类别集合中时,具体用于: 在截取出的子图像中依次选取待聚类的子图像,以选取的子图像作为聚类中心, 执行第二聚类过程,直至遍历完待聚类的全部子图像;其中,所述第二聚类过程包括: 计算所述选取的子图像的特征向量与除所述选取的子图像之外的每个待聚类的 子图像的特征向量之间的第三特征相似度; 基于每个待聚类的子图像对应的第三特征相似度,筛选出对应的第三特征相似度 大于第一设定阈值的待聚类的子图像; 将所述选取的子图像、以及所述对应的第三特征相似度大于第一设定阈值的待聚 类的子图像划分至同一类别集合中。 一种可能的设计中,所述调整模块,在基于划分的各类别集合中包括的子图像的 帧号,确定待调整的类别集合时,具体用于: 确定划分的各类别集合中子图像的最大帧号以及最小帧号; 检测划分的各类别集合分别对应的最大帧号和最小帧号之间的中间帧号是否连 续; 将中间帧号不连续的类别集合确定为待调整的类别集合。 一种可能的设计中,所述调整模块,在调整所述待调整的类别集合中包括的子图 像时,具体用于: 针对第n个待调整的类别集合,确定所述第n个待调整的类别集合中缺失的中间帧 号; 确定除所述第n个待调整的类别集合之外的其它类别集合中与所述缺失的中间帧 号匹配的第一候选子图像;以及,确定所述第n个待调整的类别集合中与所述缺失的中间帧 8 CN 111597980 A 说 明 书 5/16 页 号相邻的帧号匹配的第一参考子图像; 计算所述第一参考子图像的特征向量与每个第一候选子图像的特征向量之间的 第四特征相似度; 基于每个第一参考子图像对应的第四特征相似度,筛选出对应的第四特征相似度 大于第二设定阈值的第一候选子图像; 将筛选出的第一候选子图像划分至所述第n个待调整的类别集合中。 一种可能的设计中,所述调整模块,在确定除所述第n个待调整的类别集合之外的 其它类别集合中与所述缺失的中间帧号匹配的第一候选子图像时,具体用于: 从所述其它类别集合中筛选出子图像的帧号为所述缺失的中间帧号的第一候选 类别集合; 确定所述第一候选类别集合中包括的帧号为所述缺失的中间帧号的第一候选子 图像。 一种可能的设计中,所述调整模块,在基于划分的各类别集合中包括的子图像的 帧号,确定待调整的类别集合时,具体用于: 针对划分的第n个类别集合,确定第n个类别集合中子图像的最大帧号、以及与所 述最大帧号匹配的第二参考子图像; 确定除所述第n个类别集合之外的其它类别集合中与所述最大帧号的下一帧号匹 配的第二候选子图像; 计算所述第二参考子图像的特征向量与每个第二候选子图像的特征向量之间的 第四特征相似度; 当存在所述第四特征相似度大于第二设定阈值的第二候选子图像时,将所述第四 特征相似度大于第二设定阈值的第二候选子图像所在的第二候选类别集合、以及所述第n 个类别集合,确定为待调整的类别集合。 一种可能的设计中,所述调整模块,在调整所述待调整的类别集合中包括的子图 像时,具体用于: 将所述第二候选类别集合中包括的所述第四特征相似度大于所述第二设定阈值 的第二候选子图像划分至所述第n个类别集合中。 一种可能的设计中,所述调整模块,在基于划分的各类别集合中包括的子图像的 帧号,确定待调整的类别集合时,具体用于: 针对划分的第n个类别集合,确定第n个类别集合中子图像的最小帧号、以及与所 述最小帧号匹配的第三参考子图像; 确定除所述第n个类别集合之外的其它类别集合中与所述最小帧号的上一帧号匹 配的第三候选子图像; 计算所述第三参考子图像的特征向量与每个第三候选子图像的特征向量之间的 第四特征相似度; 当存在所述第四特征相似度大于第二设定阈值的第三候选子图像时,将所述第四 特征相似度大于第二设定阈值的第三候选子图像所在的第三候选类别集合、以及所述第n 个类别集合,确定为待调整的类别集合。 一种可能的设计中,所述调整模块,在调整所述待调整的类别集合中包括的子图 9 CN 111597980 A 说 明 书 6/16 页 像时,具体用于: 将所述第三候选类别集合中包括的所述第四特征相似度大于所述第二设定阈值 的第三候选子图像划分至所述第n个类别集合中。 第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述 存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述 存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或 第一方面的任一种可能的实施方式中所述的目标对象聚类方法的步骤。 第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介 质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面的 任一种可能的实施方式中所述的目标对象聚类方法的步骤。 本申请实施例提供的目标对象聚类方法及装置,通过从所述监控视频的图像中截 取包括目标对象信息的子图像,然后从目标对象信息的子图像进行聚类时,首先基于提取 的每个子图像的特征向量,将包括相同目标对象信息的子图像划分在同一类别集合中,进 一步地,还可以利用每个类别集合中包括的子图像的帧号,来调整类别集合中包括的子图 像。通过上述方式先利用子图像的特征向量对子图像进行粗聚类,然后根据类别集合中包 含的子图像的帧号,对类别集合中包括的子图像进行调整,由此可以降低仅根据子图像的 特征向量进行聚类时产生的误差,进而提升聚类的准确率。 为使本申请实施例的上述目的、特征和优点能更明显易懂,下面将结合实施例,并 配合所附附图,作详细说明。 附图说明 为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附 图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对 范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这 些附图获得其他相关的附图。 图1示出了本申请实施例提供的一种目标对象聚类方法的流程示意图; 图2示出了本申请实施例提供的第一聚类过程的流程示意图; 图3示出了本申请实施例提供的第二聚类过程的流程示意图; 图4示出了本申请实施例提供的确定待调整的类别集合的方法流程图; 图5示出了本申请实施例提供的调整待调整的类别集合中缺失的中间帧号的方法 流程图; 图6示出了本申请实施例提供的另一种确定待调整的类别集合的方法流程图; 图7示出了本申请实施例提供的另一种确定待调整的类别集合的方法流程图; 图8示出了本申请实施例提供的一种目标对象聚类装置800的架构示意图; 图9示出了本申请实施例提供的电子设备900的结构示意图。
分享到:
收藏