logo好方法网

基于信用评估的面向联邦学习中毒攻击的防御方法


技术摘要:
本发明公开了一种基于信用评估的面向联邦学习中毒攻击的防御方法,包括三个阶段:训练阶段,利用共享数据集中的训练集和边缘端的本地数据集进行训练,避免因数据没有独立同分布导致边缘端训练的模型较差,同时可利用共享数据集的测试集进行模型的第一轮信用评估;模型  全部
背景技术:
在大多数行业中,数据是以孤岛的形式存在的,由于行业竞争、隐私安全、行政手 续复杂等问题,即使是在同一个公司的不同部门之间实现数据整合也面临着重重阻力,在 现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的,或者说所需的成本 是巨大的。 随着人工智能落地场景越来越丰富,多方整合数据从而为用户提供更好的服务迫 切性非常高,尤其是在一些风控领域,特别需要联合多家企业的数据来打造更好的信用模 型,从而提升用户贷款的效率,比如银行就非常需要运营商的通信数据、电商企业的交易数 据来提升信用模型的质量。 如何在满足数据隐私、安全和监管要求的前提下,设计一个机器学习框架,让人工 智能系统能够更加高效、准确的共同使用各自的数据,是当前人工智能发展的一个重要课 题。Google公司提出把研究的重点转移到如何解决数据孤岛的问题,提出一个满足隐私保 护和数据安全的一个可行的解决方案,叫做联邦学习。联邦学习,一种先进的机器学习方 法,可以利用来自多个节点(例如移动设备)的分布式个性化数据集,以改进服务器端模型 的性能,同时提供隐私保护针对移动用户。 联邦学习的目的是解决数据孤岛的问题:它希望做到各个企业的自有数据不出本 地,联邦系统可以通过加密机制下的参数交换方式,在不违反数据隐私保护法规的情况下, 建立一个虚拟的共有模型。这个虚拟模型就好像大家把数据聚合在一起建立的最优模型一 样。 在联邦学习中,服务器端的模型数据在边缘段的移动设备上进行分发和维护。服 务器端通过收集本地模型来更新全局模型,即使用其本地训练数据在移动设备进行更新并 在每次迭代中上传到服务器端来训练全局模型。但是,不可靠数据同样可以由移动设备上 传,导致联邦学习训练的全局模型无法达到预期的效果。例如数据中毒攻击或无意中喂入 不满足要求的数据。因此,需要找出值得信赖的可靠的边缘端作为更新的来源十分重要。
技术实现要素:
为了解决因为不良数据喂入(数据中毒,没有独立同分布的数据)导致的模型难以 优化的问题,本发明提供了基于信用评估的面向联邦学习中毒攻击的防御方法,可以挑选 合适的边缘端进行训练,从而优化全局模型的训练过程。 本发明的技术方案为: 一种基于信用评估的面向联邦学习中毒攻击的防御方法,实现所述防御方法的系 统包括一个服务器和K个终端,所述防御方法包括: 5 CN 111598143 A 说 明 书 2/5 页 (1)为服务器配置图像数据集Dglobal、验证图像数据集Dval以及共享图像数据集 Dshare,利用所述图像数据集Dglobal训练初始化一个模型Gt;为每个终端配置一个本地图像数 据集Dlocal; (2)将所述当前模型Gt和所述共享图像数据集Dshare发送至每个终端,t表示当前迭 代次数; (3)选择F个终端以模型Gt为基础,利用本地图像数据集Dlocal和共享图像数据集 Dshare中的训练图像样本对初始化模型Gt进行训练以更新模型参数,获得模型参数更新后的 模型 再利用共享图像数据集Dshare中的测试图像样本对模型 进行训练阶段的第 一轮信用评估,获得第一轮信用评估结果,其中,F≤K,K为大于2的自然数,i为模型索引,i ∈F; (4)将F个模型 上传到服务器,计算模型 与其他模型 之间的L2范数, 对L2范数进行统计以完成上传阶段的第二轮信用评估,获得第二轮信用评估结果,其中,m ∈F且m不等于i; (5)服务器将F个模型 与模型Gt聚合成模型 利用验证图像数据集Dval对 模型 进行验证以完成聚合阶段的第三轮信用评估,获得第三轮信用评估结果; (6)根据第一轮信用评估结果、第二轮信用评估结果以及第三轮信用评估结果统 计F个模型 的综合信用评估结果,根据综合信用评估结果筛选小于综合信用评估阈值 的L个模型 进行聚合获得模型Gt 1,利用图像数据集Dglobal和共享图像数据集Dshare对模 型Gt 1训练一定次数后,跳转执行步骤(2),其中L≤F。 与现有技术相比,本发明具有的有益效果为: 通过终端模型的三轮信用评估筛选信用较好的终端进行边缘模型训练,以提升全 局模型的质量,提高模型达到要求的效率。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根 据这些附图获得其他附图。 图1是本发明提供的基于信用评估的面向联邦学习中毒攻击的防御方法的流程 图; 图2是本发明提供的第一轮信用评估架构示意图; 图3是本发明提供的第二轮信用评估架构示意图; 图4是本发明提供的第三轮信用评估架构示意图; 图5是信用评估完成后的进行联邦学习示意图。 6 CN 111598143 A 说 明 书 3/5 页
分享到:
收藏