
技术摘要:
本公开关于一种图像中目标区域的确定方法、目标识别方法及装置,并具体公开了:根据第一预设图像特征,从待处理图像预先划分的区域块中获取候选区域块;根据候选区域块的第二预设图像特征,获取候选区域块中每两个相邻的区域块之间的相似度值;若根据获取的相似度值确 全部
背景技术:
相关技术中,在检测图片中未知类别的对象时,可以通过零样本目标检测技术来 进行检测。其中,在使用零样本目标检测技术来进行检测时,可以在已知类别上结合该已知 类别与待检测的未知类别在语义或其他各层特征间的联系来建立目标检测模型,然后,使 用目标检测模型来对该未知类别进行检测。 但是,在对图片中未知类别的对象进行检测前,需要先确定未知类别的对象在图 片中所处的区域,以通过对该区域的检测来实现对该区域未知类别的对象的识别。而相关 技术中,无法自动、准确地确定未知类别的对象在当前图片中所处的区域。
技术实现要素:
本公开提供一种图像中目标区域的确定方法及装置,以及一种目标识别方法及装 置,以至少解决相关技术中无法自动、准确地确定未知类别的对象在图片中所处区域的问 题。 本公开的技术方案如下: 根据本公开实施例的第一方面,提供一种图像中目标区域的确定方法,所述方法 包括: 根据第一预设图像特征,从待处理图像预先划分的区域块中获取候选区域块; 根据所述候选区域块的第二预设图像特征,获取所述候选区域块中每两个相邻的 区域块之间的相似度值; 若根据获取的相似度值确定所述候选区域块中存在满足预设相似度条件的相邻 区域块,则对该相邻区域块进行连通,将连通后的区域块作为新的候选区域块,并返回获取 所述候选区域块中每两个相邻的区域块之间的相似度值的步骤重复执行,直至根据获取的 相似度值确定所述候选区域块中不存在满足预设相似度条件的相邻区域块;其中,所述预 设相似度条件为相似度值最大且相似度值大于预设阈值; 将连通的候选区域块构成的区域作为目标区域。 可选的,所述第一预设图像特征至少包括以下之一:颜色、形状、纹理、大小; 根据第一预设图像特征,从待处理图像预先划分的区域块中获取候选区域块,包 括: 根据各第一预设图像特征,以及各第一预设图像特征对应的预设权重值,从待处 理图像预先划分的区域块中获取候选区域块。 可选的,所述第一预设图像特征与所述第二预设图像特征不同,所述第二预设图 像特征为相对于所述第一预设图像特征的高维特征;所述第一预设图像特征为相对于所述 4 CN 111598092 A 说 明 书 2/14 页 第二预设图像特征的低维特征。 根据本公开实施例的第二方面,提供一种目标识别方法,所述方法包括: 根据本公开实施例的第一方面任一所述的目标区域的确定方法,确定待处理图像 中的目标区域; 从所述待处理图像的图像数据中提取出所述目标区域对应的图像数据,以及根据 提取出的图像数据生成目标图像; 将所述目标图像输入至类别识别模型中,获取所述目标图像的全连接层特征;其 中,所述全连接层特征为所述类别识别模型的全连接层提取的所述目标图像的特征; 根据获取的所述目标图像的全连接层特征,以及预先获取的映射参数确定所述目 标图像的类别的词向量;其中,所述映射参数用于表征图像的全连接层特征与类别的词向 量之间的映射关系; 根据所述目标图像的类别的词向量,识别所述目标图像的类别。 可选的,在所述确定所述目标图像的类别的词向量之前,所述方法还包括: 将待识别图像输入至所述类别识别模型中,获取所述待识别图像的全连接层特征 以及所述类别识别模型输出的所述待识别图像的类别; 获取所述待识别图像的类别的词向量; 将获取的所述待识别图像的全连接层特征,以及所述待识别图像的类别的词向量 输入至映射参数确定模型中,获取所述映射参数确定模型输出的映射参数。 可选的,所述根据所述目标图像的类别的词向量,识别所述目标图像的类别,包 括: 获取候选类别的词向量; 获取所述目标图像的类别的词向量与所述候选类别的词向量的相似度值; 将获取的相似度值中最大的相似度值对应的候选类别确定为所述目标图像的类 别。 根据本公开实施例的第三方面,提供一种图像中目标区域的确定装置,所述装置 包括: 第一获取模块,被配置为根据第一预设图像特征,从待处理图像预先划分的区域 块中获取候选区域块; 第二获取模块,被配置为根据所述候选区域块的第二预设图像特征,获取所述候 选区域块中每两个相邻的区域块之间的相似度值; 连通模块,被配置为若根据获取的相似度值确定所述候选区域块中存在满足预设 相似度条件的相邻区域块,则对该相邻区域块进行连通,将连通后的区域块作为新的候选 区域块,并返回获取所述候选区域块中每两个相邻的区域块之间的相似度值的步骤重复执 行,直至根据获取的相似度值确定所述候选区域块中不存在满足预设相似度条件的相邻区 域块;其中,所述预设相似度条件为相似度值最大且相似度值大于预设阈值; 确定模块,被配置为将连通的候选区域块构成的区域作为目标区域。 可选的,所述第一预设图像特征至少包括以下之一:颜色、形状、纹理、大小; 所述第一获取模块用于: 根据各第一预设图像特征,以及各第一预设图像特征对应的预设权重值,从待处 5 CN 111598092 A 说 明 书 3/14 页 理图像预先划分的区域块中获取候选区域块。 可选的,所述第一预设图像特征与所述第二预设图像特征不同,所述第二预设图 像特征为相对于所述第一预设图像特征的高维特征;所述第一预设图像特征为相对于所述 第二预设图像特征的低维特征。 根据本公开实施例的第四方面,提供一种目标识别装置,所述装置包括: 目标区域确定模块,被配置为根据本公开的实施例的第一方面任一所述的目标区 域的确定方法,确定待处理图像中的目标区域; 生成模块,被配置为从所述待处理图像的图像数据中提取出所述目标区域对应的 图像数据,以及根据提取出的图像数据生成目标图像; 全连接层特征获取模块,被配置为将所述目标图像输入至类别识别模型中,获取 所述目标图像的全连接层特征;其中,所述全连接层特征为所述类别识别模型的全连接层 提取的所述目标图像的特征; 词向量确定模块,被配置为根据获取的所述目标图像的全连接层特征,以及预先 获取的映射参数确定所述目标图像的类别的词向量;其中,所述映射参数用于表征图像的 全连接层特征与类别的词向量之间的映射关系; 识别模块,被配置为根据所述目标图像的类别的词向量,识别所述目标图像的类 别。 可选的,在所述确定所述目标图像的类别的词向量之前,所述装置还包括: 输入模块,被配置为将待识别图像输入至所述类别识别模型中,获取所述待识别 图像的全连接层特征以及所述类别识别模型输出的所述待识别图像的类别; 词向量获取模块,被配置为获取所述待识别图像的类别的词向量; 映射参数获取模块,被配置为将获取的所述待识别图像的全连接层特征,以及所 述待识别图像的类别的词向量输入至映射参数确定模型中,获取所述映射参数确定模型输 出的映射参数。 可选的,所述识别模块用于: 获取候选类别的词向量; 获取所述目标图像的类别的词向量与所述候选类别的词向量的相似度值; 将获取的相似度值中最大的相似度值对应的候选类别确定为所述目标图像的类 别。 根据本公开实施例的第五方面,提供一种电子设备,包括: 处理器; 用于存储所述处理器可执行指令的存储器; 其中,所述处理器被配置为执行所述指令,以实现如上述第一方面任一项所述的 图像中目标区域的确定方法步骤,或如上述第二方面任一项所述的目标识别方法步骤。 根据本公开实施例的第六方面,当所述存储介质中的指令由电子设备的处理器执 行时,使得电子设备能够执行如上述第一方面任一项所述的图像中目标区域的确定方法步 骤,或如上述第二方面任一项所述的目标识别方法步骤。 根据本公开实施例的第七方面,提供一种计算机程序产品,包括: 当其在设备上运行时,使得电子设备执行:上述第一方面任一项所述的图像中目 6 CN 111598092 A 说 明 书 4/14 页 标区域的确定方法步骤,或上述第二方面任一项所述的目标识别方法步骤。 本公开的实施例提供的技术方案至少带来以下有益效果: 本公开的实施例提供的技术方案可以根据第一预设图像特征,从待处理图像预先 划分的区域块中获取候选区域块,然后,可以根据候选区域块的第二预设图像特征,来获取 候选区域块中每两个相邻的区域块之间的相似度值,若根据获取的相似度值确定候选区域 块中存在满足相似度条件的相邻区域块,则可以对该相邻区域块进行连通,将连通后的区 域块作为新的候选区域块,并返回获取候选区域块中每两个相邻的区域块之间的相似度值 的步骤重复执行,直到根据获取的相似度值确定候选区域块中不存在满足预设相似条件的 相邻区域块,其中,预设相似度条件可以为相似度值最大且相似度值大于预设阈值,然后, 可以将连通的候选区域块构成的区域作为目标区域。 由上述内容可知,上述实施例可以根据第一预设图像特征以及第二预设图像特征 来从待处理图像的候选区域块中找到较为相似的候选区域块,并对较为相似的候选区域块 进行连通,以及将连通的候选区域块构成的区域作为目标区域。由于上述实施例确定的目 标区域是由多个较为相似的候选区域块连通而来,而图像的区域块中用于构成同一对象的 区域块之间较为相似,因此,上述实施例确定的目标区域较大概率属于同一个对象。因此, 根据上述实施例可以较好地从待处理图像中自动,且较为准确地确定未知类别的对象所处 的区域,从而可以有效解决现有技术的问题。 此外,本公开的实施例还提供了一种目标识别方法,可以在根据上述实施例中的 步骤确定待处理图像中的目标区域后,从待处理图像的图像数据中提取出目标区域对应的 图像数据,以及根据提取出的图像数据生成目标图像,将目标图像输入至类别识别模型中, 获取目标图像的全连接层特征,其中,全连接层特征可以为类别识别模型的全连接层提取 的目标图像的特征,然后,可以根据获取的目标图像的全连接层特征,以及预先获取的映射 参数确定目标图像的类别的词向量,并根据目标图像的类别的词向量,识别目标图像的类 别。 由此可知,本公开示出的实施例还可以在确定待处理图像中的目标区域,即未知 类别的对象所在的区域后,对目标区域进行类别识别,以确定目标区域的对象的类别,实现 对未知类别的对象的类别识别。 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本公开。 附图说明 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施 例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。 图1是根据一示例性实施例示出的一种图像中目标区域的确定方法的流程图。 图2是根据一示例性实施例示出的一种目标识别方法的流程图。 图3是根据一示例性实施例示出的一种图像中目标区域的确定装置的框图。 图4是根据一示例性实施例示出的一种目标识别装置的框图。 图5是根据一示例性实施例示出的一种图像中目标区域的确定设备的硬件结构示 意图。 7 CN 111598092 A 说 明 书 5/14 页 图6是根据一示例性实施例示出的一种目标识别设备的硬件结构示意图。