
技术摘要:
本申请实施例公开了数据增强策略搜索方法、装置、设备以及存储介质,涉及人工智能技术领域。该方法的一具体实施方式包括:获取模型的训练脚本、训练数据集和数据增强策略配置信息;基于数据增强策略配置信息,生成数据增强策略搜索空间;在数据增强策略搜索空间中对训 全部
背景技术:
包括:获取模型 的训练脚本、训练数据集和数据增强策略配置信 息;基于数据增强策略配置信息,生成数据增强 策略搜索空间;在数据增强策略搜索空间中对训 练数据集进行数据增强,以及利用数据增强的训 练数据集对训练脚本进行模型训练,自动搜索数 据增强策略搜索空间中的数据增强策略的目标 增强值。该实施方式通过自动搜索的方式进行数 据增强策略的搜索,大大缩短了为训练数据集选 择较优的数据增强策略所花费的时间。 CN 111582375 A CN 111582375 A 权 利 要 求 书 1/2 页 1.一种数据增强策略搜索方法,包括: 获取模型的训练脚本、训练数据集和数据增强策略配置信息; 基于所述数据增强策略配置信息,生成数据增强策略搜索空间; 在所述数据增强策略搜索空间中对所述训练数据集进行数据增强,以及利用数据增强 的训练数据集对所述训练脚本进行模型训练,自动搜索所述数据增强策略搜索空间中的数 据增强策略的目标增强值。 2.根据权利要求1所述的方法,其中,所述在所述数据增强策略搜索空间中对所述训练 数据集进行数据增强,以及利用数据增强的训练数据集对所述训练脚本进行模型训练,自 动搜索所述数据增强策略搜索空间中的数据增强策略的目标增强值,包括: 对于所述数据增强策略搜索空间中的数据增强策略的候选增强值,将所述训练数据集 作为第一组件,调用该候选增强值进行数据增强,得到该候选增强值对应的训练数据集,以 及将所述训练脚本作为第二组件,调用该的候选增强值对应的训练数据集进行模型训练, 得到该候选增强值对应的模型; 将满足预设效果的模型对应的候选增强值确定为所述目标增强值。 3.根据权利要求1所述的方法,其中,所述获取数据增强策略配置信息,包括: 将所述数据增强策略配置信息作为第三组件,以及从组件化配置信息提交接口获取所 述数据增强策略配置信息,其中,所述数据增强策略配置信息的提交方式包括在线提交或 命令行提交。 4.根据权利要求1所述的方法,其中,所述方法还包括: 利用所述目标增强值对所述训练数据集进行数据增强,得到目标训练数据集; 利用所述目标训练数据集进行训练,得到目标模型。 5.根据权利要求1-4之一所述的方法,其中,数据增强策略包括以下至少一种:水平翻 转、垂直翻转、随机剪裁、高斯模糊、图像锐度和图像旋转。 6.一种数据增强策略搜索装置,包括: 模型信息获取模块,被配置成获取模型的训练脚本、训练数据集和数据增强策略配置 信息; 搜索空间生成模块,被配置成基于所述数据增强策略配置信息,生成数据增强策略搜 索空间; 增强策略搜索模块,被配置成在所述数据增强策略搜索空间中对所述训练数据集进行 数据增强,以及利用数据增强的训练数据集对所述训练脚本进行模型训练,自动搜索所述 数据增强策略搜索空间中的数据增强策略的目标增强值。 7.根据权利要求6所述的装置,其中,所述增强策略搜索模块进一步被配置成: 对于所述数据增强策略搜索空间中的数据增强策略的候选增强值,将所述训练数据集 作为第一组件,调用该候选增强值进行数据增强,得到该候选增强值对应的训练数据集,以 及将所述训练脚本作为第二组件,调用该候选增强值对应的训练数据集进行模型训练,得 到该候选增强值对应的模型; 将满足预设效果的模型对应的候选增强值确定为所述目标增强值。 8.根据权利要求6所述的装置,其中,所述模型信息获取模块进一步被配置成: 将所述数据增强策略配置信息作为第三组件,以及从组件化配置信息提交接口获取所 2 CN 111582375 A 权 利 要 求 书 2/2 页 述数据增强策略配置信息,其中,所述数据增强策略配置信息的提交方式包括在线提交或 命令行提交。 9.根据权利要求6所述的装置,其中,所述装置还包括: 数据增强模块,被配置成利用所述目标增强值对所述训练数据集进行数据增强,得到 目标训练数据集; 模型训练模块,被配置成利用所述目标训练数据集进行训练,得到目标模型。 10.根据权利要求6-9之一所述的装置,其中,数据增强策略包括以下至少一种:水平翻 转、垂直翻转、随机剪裁、高斯模糊、图像锐度和图像旋转。 11.一种电子设备,包括: 一个或多个处理器; 存储装置,其上存储有一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实 现如权利要求1-5中任一所述的方法。 12.一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执 行时实现如权利要求1-5中任一所述的方法。 3 CN 111582375 A 说 明 书 1/9 页 数据增强策略搜索方法、装置、设备以及存储介质 技术领域 本申请实施例涉及计算机技术领域,具体涉及人工智能技术领域。
技术实现要素:
深度学习技术在很多方向上都取得了巨大的成功。在深度学习技术中,模型的训 练数据集的数据增强策略对模型的性能和效果有着非常重要的影响。 目前,几乎所有的模型在训练过程中都需要加入数据增强策略,以提升模型的精 度和鲁棒性。而传统的数据增强策略设定严重依赖人工的干预,例如人工设定数据增强策 略,并花费大量的时间进行多次调节,以得到较优的数据增强策略。