
技术摘要:
本发明提出了一种自动更新深度学习模型的方法、装置及存储介质,该方法包括:服务器将训练后的初始第一深度学习模型部署到客户端中,采集用于用户的输入数据作为采集的实际样本,在服务器使用第二深度学习模型对实际样本进行机器标注得到标注后的实际样本;服务器使用 全部
背景技术:
随着人工智能的发展,目前基于机器学习的算法应用越来越广泛。而一般训练算 法模型的主要步骤为:人工标注数据、模型训练以及模型部署。算法模型需要利用大量训练 样本进行训练,然后用测试样本进行测试,测试通过后,投入线上使用。目前针对数据标注 主要还是依赖于人工参与的方法。随着数据量越来越大,使用人工标注的方法成本将大大 增加,对于复杂应用比如语义分割等任务,采用人工标注数据效率低下。 目前模型训练使用的数据集主要使用开源的公开数据集,这些数据集训练出来的 模型可能与实际场景应用数据不属于同一分布,训练出来的模型效果在实际场景应用中不 好。 随着边缘计算的普及,越来越多的算法模型都部署在前端设备当中,由于前端设 备计算性能条件限制以及业务对算法实时性硬性要求,导致很多效果好的比较复杂的算法 模型无法部署在前端,只能折中部署一些模型相对较小,精度可以达到要求,速度能达到要 求的算法模型。 可见,现有技术中,无法针对具体的场景对学习模型使用实际的样本进行再训练, 导致学习模型的识别性能较差,影响了用户体验,且现有技术中,训练数据集(也称为训练 样本)都是采用人工标注,标注效率低下,无法适用学习模型的在前端的部署速度,即使有 部分机器标注的例子,由于模型的权重设置不合理,标准准确率也较低。
技术实现要素:
本发明针对上述现有技术中的一个或多个缺陷,提出了如下技术方案。 一种自动更新深度学习模型的方法,该方法包括: 部署步骤,服务器使用第一数据集对第一深度学习模型训练得到训练后的初始第 一深度学习模型,并将所述初始第一深度学习模型部署到客户端中; 采集步骤,用户使用所述客户端输入数据并将所述输入数据发送所述服务器作为 采集的实际样本; 标注步骤,在所述服务器端使用第二深度学习模型对所述实际样本进行机器标注 得到标注后的实际样本; 重训练步骤,服务器使用第一数据集和标注后的实际样本对所述初始第一深度学 习模型进行再训练得到重训练后的第一深度学习模型; 更新步骤,判断所述重训练后的第一深度学习模型的性能是否大于所述初始第一 深度学习模型,如果是,服务器将所述重训练后的第一深度学习模型发送至所述客户端更 新所述初始第一深度学习模型。 4 CN 111612161 A 说 明 书 2/8 页 更进一步地,所述第一深度学习模型的识别性能低于所述第二深度学习模型,且 所述第一深度学习模型运行时消耗的系统资源小于所述第二深度学习模型运行时消耗的 系统资源。 更进一步地,所述输入数据为人脸图像数据、指纹图像数据、虹膜图像数据或声纹 数据。 更进一步地,在所述服务器端使用第二深度学习模型对所述实际样本进行机器标 注得到标注后的实际样本的操作为: 所述第二深度学习模型为多个,使用所述多个第二深度学习模型对所述实际样本 进行识别,如果每个所述第二深度学习模型的识别结果都一致时,使用所述识别结果对所 述实际样本进行标注; 或者,所述第二深度学习模型为多个,使用所述多个第二深度学习模型对所述实 际样本进行识别得到对应的识别结果,将所有的识别结果加权相加后作为识别结果对所述 实际样本进行标注; 或者,所述第二深度学习模型为多个,将所述多个第二深度学习模型进行串联后 对所述实际样本进行识别得到最后的识别结果对所述实际样本进行标注。 更进一步地,判断所述重训练后的第一深度学习模型的性能是否大于所述初始第 一深度学习模型的操作为:使用所述重训练后的第一深度学习模型对部分标注后的实际样 本进行识别,如果识别率大于所述初始第一深度学习模型对所述部分标注后的实际样本准 确率,则所述重训练后的第一深度学习模型的性能大于所述初始第一深度学习模型。 本发明还提出了一种自动更新深度学习模型的装置,该装置包括: 部署单元,用于服务器使用第一数据集对第一深度学习模型训练得到训练后的初 始第一深度学习模型,并将所述初始第一深度学习模型部署到客户端中; 采集单元,用于用户使用所述客户端输入数据并将所述输入数据发送所述服务器 作为采集的实际样本; 标注单元,用于在所述服务器端使用第二深度学习模型对所述实际样本进行机器 标注得到标注后的实际样本; 重训练单元,用于服务器使用第一数据集和标注后的实际样本对所述初始第一深 度学习模型进行再训练得到重训练后的第一深度学习模型; 更新单元,用于判断所述重训练后的第一深度学习模型的性能是否大于所述初始 第一深度学习模型,如果是,服务器将所述重训练后的第一深度学习模型发送至所述客户 端更新所述初始第一深度学习模型。 更进一步地,所述第一深度学习模型的识别性能低于所述第二深度学习模型,且 所述第一深度学习模型运行时消耗的系统资源小于所述第二深度学习模型运行时消耗的 系统资源。 更进一步地,所述输入数据为人脸图像数据、指纹图像数据、虹膜图像数据或声纹 数据。 更进一步地,在所述服务器端使用第二深度学习模型对所述实际样本进行机器标 注得到标注后的实际样本的操作为: 所述第二深度学习模型为多个,使用所述多个第二深度学习模型对所述实际样本 5 CN 111612161 A 说 明 书 3/8 页 进行识别,如果每个所述第二深度学习模型的识别结果都一致时,使用所述识别结果对所 述实际样本进行标注; 或者,所述第二深度学习模型为多个,使用所述多个第二深度学习模型对所述实 际样本进行识别得到对应的识别结果,将所有的识别结果加权相加后作为识别结果对所述 实际样本进行标注; 或者,所述第二深度学习模型为多个,将所述多个第二深度学习模型进行串联后 对所述实际样本进行识别得到最后的识别结果对所述实际样本进行标注。 更进一步地,判断所述重训练后的第一深度学习模型的性能是否大于所述初始第 一深度学习模型的操作为:使用所述重训练后的第一深度学习模型对部分标注后的实际样 本进行识别,如果识别率大于所述初始第一深度学习模型对所述部分标注后的实际样本准 确率,则所述重训练后的第一深度学习模型的性能大于所述初始第一深度学习模型。 本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序代 码,当所述计算机程序代码被计算机执行时执行上述之任一的装置。 本发明的技术效果在于:本发明的一种自动更新深度学习模型的方法、装置及存 储介质,该方法包括:服务器使用第一数据集对第一深度学习模型训练得到训练后的初始 第一深度学习模型,并将所述初始第一深度学习模型部署到客户端中;用户使用所述客户 端输入数据并将所述输入数据发送所述服务器作为采集的实际样本;在所述服务器端使用 第二深度学习模型对所述实际样本进行机器标注得到标注后的实际样本;服务器使用第一 数据集和标注后的实际样本对所述初始第一深度学习模型进行再训练得到重训练后的第 一深度学习模型;判断所述重训练后的第一深度学习模型的性能是否大于所述初始第一深 度学习模型,如果是,服务器将所述重训练后的第一深度学习模型发送至所述客户端更新 所述初始第一深度学习模型。本发明通过在后端服务器部署多个强大算法模型进行真实应 用环境中的数据采集并自动进行标注,然后使用标注后的数据集重新训练客户端比较简单 的模型,并更新到前端设备当中,解决了人工标注样本速度慢导致无法及时更新客户端学 习模型的技术问题,提高了用户体验,并提出了多模型标注时的权重计算公式,提高了使用 多模型标注的准确率。 附图说明 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它 特征、目的和优点将会变得更明显。 图1是根据本发明的实施例的一种自动更新深度学习模型的方法的流程图。 图2是根据本发明的实施例的一种自动更新深度学习模型的装置的结构图。