logo好方法网

一种图像识别方法、设备、电子设备和存储介质


技术摘要:
本说明书一个或多个实施例提供的一种图像识别方法、设备、电子设备和存储介质,包括:确定单元结构中两个节点间的候选操作集合;确定对应的第一参数,并进行第二参数更新训练生成最终参数,确定最终参数所对应的最优候选操作,将两个节点通过最优候选操作进行连接;将  全部
背景技术:
随着社会进步和科技发展,图像已经成为人们获取信息的重要方式。近年来,出现 在生活中的图像数据增长迅速,对于数量如此巨大的图像数据,快速有效的图像处理分析 方法是被迫切需要的。这使得图像识别技术成为了一个热门的研究方向。神经网络是近年 来兴起的一种人工神经网络与深度学习理论相结合的模式识别方法,目前已经成为图像分 类识别领域中的研究热点之一。但是,一般的神经网络设计依赖于人类专家的知识,针对具 体的任务、数据集和运算条件,设计与之匹配的神经网络结构,这使得设计网络非常依赖于 经验和具体场景,各种超参数调整也费时费力。 现有技术中,神经网络结构设计是一个需要专业人员的大量实验经验的过程,针 对特定的数据集、特定的运算设备来设计合适的神经网络结构更加是一个费时费力的工 程。已有的许多神经架构算法,一方面在搜索阶段需要大量的运算资源,另一方面难以稳定 的提供满足要求的结构。
技术实现要素:
有鉴于此,本说明书一个或多个实施例的目的在于提出一种图像识别方法、设备、 电子设备和存储介质。 基于上述目的,本说明书一个或多个实施例提供的一种图像识别方法,包括: 确定单元结构中两个节点间的候选操作集合; 确定所述候选操作集合中的候选操作所对应的第一参数,根据所述第一参数进行 第二参数更新训练生成最终参数,确定所述最终参数所对应的最优候选操作,将所述两个 节点通过所述最优候选操作进行连接; 将连接所述节点后的所述单元结构置入预设的结构框架,并进行图像识别训练, 生成图像识别模型; 当用户进行图像识别时,获取用户输入的图像,将所述图像输入所述图像识别模 型,输出识别结果。 在一些实施方式中,所述根据所述第一参数进行第二参数更新训练生成最终参 数,包括:当所述第一参数为网络参数时,所述第二参数为结构参数;具体为: 获取所述候选操作所对应的结构参数,对所述结构参数进行逻辑回归生成出现概 率,根据所述出现概率无放回的在所述候选操作集合中选取两个所述候选操作生成选出操 作; 生成所述选出操作对应的布尔门值,获取所述单元结构的输入值,使所述输入值 分别通过一种所述选出操作生成输出值,获取所述输出值与对应的所述布尔门值的乘积, 4 CN 111582346 A 说 明 书 2/12 页 并与另一所述输出值与对应的所述布尔门值的乘积进行求和作为最终输出,通过所述最终 输出确定损失函数,通过如下式所示的反向传播梯度公式进行结构参数更新训练生成所述 最终参数; 其中,L为损失函数,αi为第i个结构参数,p为选出操作的出现概率,g为布尔门值。 在一些实施方式中,所述通过反向传播梯度公式进行结构参数更新训练之后,对 更新后的结构参数添加修正因子,所述修正因子具体为: 其中,r为修正因子,α为结构参数,α′为更新后结构参数。 在一些实施方式中,所述通过所述最终输出确定损失函数,包括: 在所述损失函数中添加如下式所示的限制参数; 其中,E[Cost]为限制参数,N表示搜索结构总共有N个可选候选操作集合,k表示每 层有k个可选操作,Costik表示第i层第k个可选操作的运算代价,softmax(αi)为第i个结构 参数α的出现概率。 在一些实施方式中,所述根据所述第一参数进行第二参数更新训练生成最终参 数,包括:当所述第一参数为结构参数时,所述第二参数为网络参数;具体为: 对所述结构参数进行逻辑回归生成出现概率,根据所述出现概率无放回的在所述 候选操作集合中选取两个所述候选操作生成选出操作; 获取所述单元结构的输入值,使所述输入值分别通过一种所述选出操作生成输出 值,对两个所述输出值进行求和得到最终输出,对所述最终输出进行反向传播进行网络参 数更新训练生成所述最终参数。 在一些实施方式中,所述根据所述第一参数进行第二参数更新训练生成最终参 数,包括: 在训练过程中,对所述候选操作集中所述出现概率最大的第一参数进行随机失活 操作;所述随机失活操作的概率具体为: 其中,P为随机失活操作的概率,T为训练过程总共进行的轮数,k为当前运行的轮 数。 在一些实施方式中,所述根据所述第一参数进行第二参数更新训练生成最终参 数,包括: 当第二参数更新训练进行至设定轮数时,在所述候选操作集合中删除所述结构参 数最低的所述候选操作。 基于同一构思,本说明书一个或多个实施例还提供了一种图像识别设备,包括: 5 CN 111582346 A 说 明 书 3/12 页 确定模块,确定单元结构中两个节点间的候选操作集合; 连接模块,确定所述候选操作集合中的候选操作所对应的第一参数,根据所述第 一参数进行第二参数更新训练生成最终参数,确定所述最终参数所对应的最优候选操作, 将所述两个节点通过所述最优候选操作进行连接; 生成模块,将连接所述节点后的所述单元结构置入预设的结构框架,并进行图像 识别训练,生成图像识别模型; 识别模块,当用户进行图像识别时,获取用户输入的图像,将所述图像输入所述图 像识别模型,输出识别结果。 基于同一构思,本说明书一个或多个实施例还提供了一种电子设备,包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执 行所述程序时实现如上任意一项所述的方法。 基于同一构思,本说明书一个或多个实施例还提供了一种非暂态计算机可读存储 介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于 使所述计算机执行如上任一所述方法。 从上面所述可以看出,本说明书一个或多个实施例提供的一种图像识别方法、设 备、电子设备和存储介质,包括:确定单元结构中两个节点间的候选操作集合;确定所述候 选操作集合中的候选操作所对应的第一参数,根据所述第一参数进行第二参数更新训练生 成最终参数,确定所述最终参数所对应的最优候选操作,将所述两个节点通过所述最优候 选操作进行连接;将连接所述节点后的所述单元结构置入预设的结构框架,并进行图像识 别训练,生成图像识别模型;当用户进行图像识别时,获取用户输入的图像,将所述图像输 入所述图像识别模型,输出识别结果。本说明书一个或多个实施例通过在设定的搜索空间 中搜索出与图像识别数据、场景相适应的神经网络结构,显著提升图像识别精度,降低在运 算设备上的时延,减少专业人员在神经网络结构设计上的时间消耗。 附图说明 为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将 对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的 附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性 劳动的前提下,还可以根据这些附图获得其他的附图。 图1为本说明书一个或多个实施例提出的一种图像识别方法的流程示意图; 图2为本说明书一个或多个实施例提出的一种图像识别设备的结构示意图; 图3为本说明书一个或多个实施例提出的电子设备结构示意图。
分享到:
收藏