
技术摘要:
本申请涉及计算机技术领域,尤其涉及一种目标检索方法及装置,获取待检索对象;从所述待检索对象中检测获得目标对应的图像区域,若从所述待检索对象中检测获得多个目标对应的图像区域,则将所述多个目标对应的图像区域通过终端展示给用户,并接收所述终端返回的用户输 全部
背景技术:
随着科技的发展,图像检索被应用到越来越多的场景中,用户有检索图像或某物 体的需求,现有技术中,通常是针对不同类别的物体分别训练获得其分类模型,进而在检索 时,基于分类模型识别物体类别,然后检索出与其同类别相似的物体,但是这种方式,需要 预先针对不同类别的物体进行训练,因此训练的分类模型也仅适用于单一类别物体,例如, 采用猫的图像进行训练的分类模型,并不适用于狗的分类和检索,通用性较差,若想检索其 它类别物体,还需要重新训练,也降低了效率,增加了成本。
技术实现要素:
本申请实施例提供一种目标检索方法及装置,以提高目标检索的效率和通用性。 本申请实施例提供的具体技术方案如下: 一种目标检索方法,包括: 获取待检索对象; 从所述待检索对象中检测获得目标对应的图像区域,若从所述待检索对象中检测 获得多个目标对应的图像区域,则将所述多个目标对应的图像区域通过终端展示给用户, 并接收所述终端返回的用户输入的选择指令,其中,所述选择指令中至少包括选中的目标 对应的图像区域; 根据所述选择指令中的目标对应的图像区域,获得所述目标的目标特征向量; 根据所述目标的目标特征向量,在检索数据库中进行检索,获得目标特征向量相 似度大于阈值的对象,其中,所述检索数据库中至少包括多个关联的对象和对象中包括的 各个目标的目标特征向量。 可选的,根据所述选择指令中的目标对应的图像区域,获得所述目标的目标特征 向量,具体包括: 若所述待检索对象的类型为图像,则基于已训练的特征提取模型,以所述目标对 应的图像区域为输入参数,对所述目标对应的图像区域进行特征提取,获得所述目标的图 像特征向量,并将所述图像特征向量作为所述目标的目标特征向量。 可选的,从所述待检索对象中检测获得目标对应的图像区域,具体包括: 若所述待检索对象的类型为视频,则确定所述目标对应的图像区域在所述待检索 对象的视频帧的位置信息; 并根据所述位置信息,对所述目标进行跟踪,确定所述目标在追踪到的各视频帧 上的位置信息和对应的图像区域。 可选的,根据所述选择指令中的目标对应的图像区域,获得所述目标的目标特征 向量,具体包括: 4 CN 111581423 A 说 明 书 2/12 页 基于已训练的特征提取模型,分别对所述目标在对应的各视频帧中的图像区域, 进行特征提取,获得所述目标在对应的各视频帧中的图像特征向量; 根据获得的所述目标在对应的各视频帧中的图像特征向量,确定所述目标的平均 图像特征向量,并将所述平均图像特征向量,作为所述目标的目标特征向量。 可选的,根据所述目标的目标特征向量,在检索数据库中进行检索,获得目标特征 向量相似度大于阈值的对象,具体包括: 将所述目标的目标特征向量,分别与所述检索数据库中各个簇类的中心目标特征 向量进行比对,确定出相似度最高的簇类,其中,所述检索数据库中包括多个簇类,每个簇 类中包括多个目标的目标特征向量,所述多个簇类是基于聚类算法将所述检索数据库中的 各个目标进行聚类后获得的; 将所述目标的目标特征向量,与所述相似度最高的簇类中包括的各目标的目标特 征向量进行比对,获得目标特征向量相似度大于阈值的目标; 根据目标与对象的关联关系,获得目标特征向量相似度大于阈值的对象。 可选的,所述检索数据库的获得方式为: 获取对象样本集,其中,所述对象样本集中包括多个对象样本,所述对象样本的类 型为图像或视频; 分别从各个对象样本中检测获得各个目标对应的图像区域,并根据所述各个目标 对应的图像区域,分别获得所述各个目标的目标特征向量; 将所述各个目标的目标特征向量,与对应的对象样本关联存储,并更新到检索数 据库中。 一种目标检索装置,包括: 获取模块,用于获取待检索对象; 第一处理模块,用于从所述待检索对象中检测获得目标对应的图像区域,若从所 述待检索对象中检测获得多个目标对应的图像区域,则将所述多个目标对应的图像区域通 过终端展示给用户,并接收所述终端返回的用户输入的选择指令,其中,所述选择指令中至 少包括选中的目标对应的图像区域; 第二处理模块,用于根据所述选择指令中的目标对应的图像区域,获得所述目标 的目标特征向量; 检索模块,用于根据所述目标的目标特征向量,在检索数据库中进行检索,获得目 标特征向量相似度大于阈值的对象,其中,所述检索数据库中至少包括多个关联的对象和 对象中包括的各个目标的目标特征向量。 可选的,根据所述选择指令中的目标对应的图像区域,获得所述目标的目标特征 向量时,第二处理模块具体用于: 若所述待检索对象的类型为图像,则基于已训练的特征提取模型,以所述目标对 应的图像区域为输入参数,对所述目标对应的图像区域进行特征提取,获得所述目标的图 像特征向量,并将所述图像特征向量作为所述目标的目标特征向量。 可选的,从所述待检索对象中检测获得目标对应的图像区域时,第二处理模块具 体用于: 若所述待检索对象的类型为视频,则确定所述目标对应的图像区域在所述待检索 5 CN 111581423 A 说 明 书 3/12 页 对象的视频帧的位置信息; 并根据所述位置信息,对所述目标进行跟踪,确定所述目标在追踪到的各视频帧 上的位置信息和对应的图像区域。 可选的,根据所述选择指令中的目标对应的图像区域,获得所述目标的目标特征 向量时,第二处理模块具体用于: 基于已训练的特征提取模型,分别对所述目标在对应的各视频帧中的图像区域, 进行特征提取,获得所述目标在对应的各视频帧中的图像特征向量; 根据获得的所述目标在对应的各视频帧中的图像特征向量,确定所述目标的平均 图像特征向量,并将所述平均图像特征向量,作为所述目标的目标特征向量。 可选的,根据所述目标的目标特征向量,在检索数据库中进行检索,获得目标特征 向量相似度大于阈值的对象时,检索模块具体用于: 将所述目标的目标特征向量,分别与所述检索数据库中各个簇类的中心目标特征 向量进行比对,确定出相似度最高的簇类,其中,所述检索数据库中包括多个簇类,每个簇 类中包括多个目标的目标特征向量,所述多个簇类是基于聚类算法将所述检索数据库中的 各个目标进行聚类后获得的; 将所述目标的目标特征向量,与所述相似度最高的簇类中包括的各目标的目标特 征向量进行比对,获得目标特征向量相似度大于阈值的目标; 根据目标与对象的关联关系,获得目标特征向量相似度大于阈值的对象。 可选的,针对所述检索数据库的获得方式,还包括建立模块,用于: 获取对象样本集,其中,所述对象样本集中包括多个对象样本,所述对象样本的类 型为图像或视频; 分别从各个对象样本中检测获得各个目标对应的图像区域,并根据所述各个目标 对应的图像区域,分别获得所述各个目标的目标特征向量; 将所述各个目标的目标特征向量,与对应的对象样本关联存储,并更新到检索数 据库中。 一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计 算机程序,所述处理器执行所述程序时实现上述任一种目标检索方法的步骤。 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执 行时实现上述任一种目标检索方法的步骤。 本申请实施例中,获取待检索对象,从待检索对象中检测获得目标对应的图像区 域,并获得目标的目标特征向量,进而根据目标的目标特征向量,在检索数据库中检索获得 相似度大于阈值的对象,这样,通过目标检测和特征提取即可以实现检索,无需区分类别, 不需要针对不同类别目标分别进行训练,提高了效率,并且适用于各种类别物体,具有通用 性,可以满足各种检索应用场景,并且若从待检索对象中检测获得多个目标对应的图像区 域时,还可以由用户进行选择,从而检索用户实际所需检索的对象,更加满足用户需求,提 高了准确性。 附图说明 图1为本申请实施例中目标检索方法流程图; 6 CN 111581423 A 说 明 书 4/12 页 图2为本申请实施例中针对图像的检测和特征提取过程示意图; 图3为本申请实施例中针对视频的检测和特征提取过程示意图; 图4为本申请实施例中目标检索装置结构示意; 图5为本申请实施例中电子设备的结构示意图。