logo好方法网

神经网络结构探测方法、结构探测模型的训练方法及装置


技术摘要:
本发明实施例涉及一种神经网络结构探测方法、结构探测模型的训练方法及装置,所述神经网络结构探测方法包括:获得参考网络在多核平台上运行时每一层的计算完成时间;将所述每一层的计算完成时间输入至已训练的结构探测模型,得到与所述参考网络运行在同一多核平台上的  全部
背景技术:
近年来,神经网络已经广泛应用在诸多领域中,比如图像识别、语言识别、恶意软 件检测等。然而,在神经网络被广泛应用的同时,一些不法行为也随之发生,例如,黑客通过 在平台上植入神经网络以实现攻击行为。据此,如何对抗此类攻击行为也变得尤为重要。 为了对抗此类攻击,可以获取黑客植入的神经网络的结构,以此来反推出神经网 络的输入数据和训练数据,生成有效的对抗样本,从而使神经网络的性能下降,最终得到错 误的预测结果。而这一方式中最重要的是如何准确获取神经网络的结构。
技术实现要素:
鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种神经网络 结构探测方法、结构探测模型的训练方法及装置。 第一方面,本发明实施例提供一种结构探测模型的构建方法,所述方法包括: 生成样本网络集; 依据所述样本网络集获得训练样本集,其中,每条训练样本以与样本网络运行在 同一多核平台上的参考网络每一层的计算完成时间为输入值,以样本网络的结构信息为标 签值; 利用设定算法对所述训练样本集进行训练,得到结构探测模型,所述结构探测模 型以所述参考网络每一层的计算完成时间为输入值,以与所述参考网络运行在同一多核平 台上的目标网络的结构信息为输出值。 在一个可能的实施方式中,所述样本网络集中的样本网络通过以下方式构建: 按照设定的组合规则将设定的各候选参数集中的结构参数进行组合,得到多组层 结构参数; 在构建样本网络时,针对该样本网络的每一层,从所述多组层结构参数中选择一 组层结构参数,依据选择的层结构参数构建该层,得到所述样本网络。 在一个可能的实施方式中,所述依据样本网络集获得训练样本集,包括: 针对所述样本网络集中的每一样本网络,获得与该样本网络运行在同一多核平台 上的参考网络每一层的计算完成时间,以及获得该样本网络的层数、每一层的结构和层位 置;将所述层数、每一层的层结构和层位置作为所述结构信息。 在一个可能的实施方式中,所述结构探测模型,包括: 深度预测网络,以所述参考网络每一层的计算完成时间为输入值,以与所述参考 网络运行在同一多核平台上的目标网络的层数为输出值。 层结构估计网络,包括层位置探测网络和层结构探测网络,所述层位置探测网络 6 CN 111582474 A 说 明 书 2/10 页 以所述参考网络每一层的计算完成时间为输入值,以与所述参考网络运行在同一多核平台 上的目标网络的每一层的层位置为输出值;所述层结构探测网络以所述参考网络每一层的 计算完成时间为输入值,以与所述参考网络运行在同一多核平台上的目标网络的每一层的 层结构为输出值。 在一个可能的实施方式中,利用设定算法对所述训练样本集进行训练,得到结构 探测模型中的深度预测网络,包括: 利用有监督学习算法对所述训练样本集进行训练,并依据第一损失函数对训练得 到的深度预测网络进行反向传播,直至满足设定的第一训练停止条件;所述第一损失函数 表示样本网络的层数和深度预测网络输出值的均方误差。 在一个可能的实施方式中,所述获得该样本网络每一层的层位置,包括: 针对该样本网络的每一层,当检测到该层计算完成时,确定所述参考网络当前计 算的层的层位置;将所述参考网络当前计算的层的层位置确定为该样本网络中层的层位 置; 利用设定算法对所述训练样本集进行训练,得到结构探测模型中的层位置探测网 络,包括: 利用有监督学习算法对所述训练样本集进行训练,并依据第二损失函数对训练得 到的层位置探测网络进行反向传播,直至满足设定的第二训练停止条件;所述第二损失函 数表示样本网络中层的层位置和层位置探测网络输出值的交叉熵。 在一个可能的实施方式中,利用设定算法对所述训练样本集进行训练,得到结构 探测模型中的结构探测网络,包括: 利用有监督学习算法对所述训练样本集进行训练,并依据第三损失函数对训练得 到的层结构探测网络进行反向传播,直至满足设定的第三训练停止条件;所述第三损失函 数表示样本网络中层的结构和层结构探测网络输出值的交叉熵。 第二方面,本发明实施例提供一种神经网络结构探测方法,所述方法包括: 获得目标网络与参考网络在多核平台上运行时,参考网络每一层的计算完成时 间; 将所述每一层的计算完成时间输入至已训练的结构探测模型,得到与所述参考网 络运行在同一多核平台上的目标网络的结构信息; 依据所述目标网络的结构信息进行拓扑结构重建,得到所述目标网络的结构。 在一个可能的实施方式中,所述依据目标网络的结构信息进行拓扑结构重建,得 到所述目标网络的结构,包括: 针对所述目标网络的每一层,依据所述结构信息中该层的层位置,在所述结构信 息中确定该层的层结构; 依据所述目标网络每一层的层位置和层结构进行拓扑结构重建,得到所述目标网 络的结构。 第三方面,本发明实施例提供一种结构探测模型的构建装置,所述装置包括: 第一生成模块,用于生成样本网络集; 第二生成模块,用于依据所述样本网络集获得训练样本集,其中,每条训练样本以 与样本网络运行在同一多核平台上的参考网络每一层的计算完成时间为输入值,以样本网 7 CN 111582474 A 说 明 书 3/10 页 络的结构信息为标签值; 训练模块,用于利用设定算法对所述训练样本集进行训练,得到结构探测模型,所 述结构探测模型以所述参考网络每一层的计算完成时间为输入值,以与所述参考网络运行 在同一多核平台上的目标网络的结构信息为输出值。 在一可能的实施方式中,所述第一生成模块生成样本网络包括: 按照设定的组合规则将设定的各候选参数集中的结构参数进行组合,得到多组层 结构参数; 在构建样本网络时,针对该样本网络的每一层,从所述多组层结构参数中选择一 组层结构参数,依据选择的层结构参数构建该层,得到所述样本网络。 在一可能的实施方式中,所述第二生成模块依据样本网络集获得训练样本集,包 括: 针对所述样本网络集中的每一样本网络,获得与该样本网络运行在同一多核平台 上的参考网络每一层的计算完成时间,以及获得该样本网络的层数、每一层的结构和层位 置;将所述层数、每一层的层结构和层位置作为所述结构信息。 在一可能的实施方式中,所述结构探测模型,包括: 深度预测网络,以所述参考网络每一层的计算完成时间为输入值,以与所述参考 网络运行在同一多核平台上的目标网络的层数为输出值。 层结构估计网络,包括层位置探测网络和层结构探测网络,所述层位置探测网络 以所述参考网络每一层的计算完成时间为输入值,以与所述参考网络运行在同一多核平台 上的目标网络的每一层的层位置为输出值;所述层结构探测网络以所述参考网络每一层的 计算完成时间为输入值,以与所述参考网络运行在同一多核平台上的目标网络的每一层的 层结构为输出值。 在一可能的实施方式中,所述训练模块利用设定算法对所述训练样本集进行训 练,得到结构探测模型中的深度预测网络,包括: 利用有监督学习算法对所述训练样本集进行训练,并依据第一损失函数对训练得 到的深度预测网络进行反向传播,直至满足设定的第一训练停止条件;所述第一损失函数 表示样本网络的层数和深度预测网络输出值的均方误差。 在一可能的实施方式中,所述第二生成模块获得该样本网络每一层的层位置,包 括: 针对该样本网络的每一层,当检测到该层计算完成时,确定所述参考网络当前计 算的层的层位置;将所述参考网络当前计算的层的层位置确定为该样本网络中层的层位 置; 所述训练模块利用设定算法对所述训练样本集进行训练,得到结构探测模型中的 层位置探测网络,包括: 利用有监督学习算法对所述训练样本集进行训练,并依据第二损失函数对训练得 到的层位置探测网络进行反向传播,直至满足设定的第二训练停止条件;所述第二损失函 数表示样本网络中层的层位置和层位置探测网络输出值的交叉熵。 在一可能的实施方式中,所述训练模块利用设定算法对所述训练样本集进行训 练,得到结构探测模型中的结构探测网络,包括: 8 CN 111582474 A 说 明 书 4/10 页 利用有监督学习算法对所述训练样本集进行训练,并依据第三损失函数对训练得 到的层结构探测网络进行反向传播,直至满足设定的第三训练停止条件;所述第三损失函 数表示样本网络中层的结构和层结构探测网络输出值的交叉熵。 第四方面,本发明实施例提供一种神经网络结构探测装置,所述装置包括: 时间获得模块,用于获得目标网络与参考网络在多核平台上运行时,参考网络每 一层的计算完成时间; 模型输入模块,用于将所述每一层的计算完成时间输入至已训练的结构探测模 型,得到所述目标网络的结构信息; 结构重建模块,用于依据所述目标网络的结构信息进行拓扑结构重建,得到所述 目标网络的结构。 在一可能的实施方式中,所述结构重建模块依据所述模型输入模块得到的所述目 标网络的结构信息进行拓扑结构重建,得到所述目标网络的结构,包括: 针对所述目标网络的每一层,依据所述结构信息中该层的层位置,在所述结构信 息中确定该层的层结构; 依据所述目标网络每一层的层位置和层结构进行拓扑结构重建,得到所述目标网 络的结构。 第五方面,本发明实施例提供一种电子设备,包括处理器、通信接口、存储器和通 信总线; 其中,所述处理器、通信接口、存储器通过所述通信总线进行相互间的通信; 所述存储器,用于存放计算机程序; 所述处理器,用于执行所述存储器上所存放的计算机程序,所述处理器执行所述 计算机程序时实现本发明实施例提供的神经网络结构探测方法或者结构探测模型的训练 方法的步骤。 第六方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介 质内存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例提供的神经网 络结构探测方法或者结构探测模型的训练方法的步骤。 本发明实施例提供的方法,通过生成样本网络集,依据样本网络集获得训练样本 集,其中,每条训练样本以与样本网络运行在同一多核平台上的参考网络每一层的计算完 成时间为输入值,以样本网络的结构信息为标签值;利用设定算法对训练样本集进行训练, 可以得到一个能够预测目标网络结构信息的结构探测模型。 通过获得参考网络在多核平台上运行时每一层的计算完成时间,将每一层的计算 完成时间输入至已训练的结构探测模型,得到与参考网络运行在同一多核平台上的目标网 络的结构信息,依据目标网络的结构信息进行拓扑结构重建,得到目标网络的结构,可以实 现通过较低的成本即可探测出目标网络的结构,并且探测结果具有较高的鲁棒性和准确 性。 附图说明 图1为本发明实施例提供的结构探测模型的构建方法的实施例流程图; 图2为本发明实施例提供的神经网络结构探测方法的实施例流程图; 9 CN 111582474 A 说 明 书 5/10 页 图3为本发明实施例提供的结构探测模型的构建装置的实施例框图; 图4为本发明实施例提供的神经网络结构探测装置的实施例框图; 图5为本发明一示例性实施例提供的一种电子设备的结构示意图。
分享到:
收藏