logo好方法网

自然人ID创建方法、存储介质、电子设备及系统


技术摘要:
本发明涉及自然人ID创建方法、存储介质、电子设备及系统;本发明对同一企业自然人的使用包含自然人姓名和企业名信息的方式进行重新编码标识,保证了在数据更新或者数据融合时,自然人ID不随意变动。在不依赖和泄露个人隐私的前提下对自然人重新编码标识,保证识别的结  全部
背景技术:
随着大数据技术的发展,对于不同数据源中的自然人是否是同一人的判断越来越 重要;不同自然人重名的情况十分常见,而在企业数据中同一自然人往往可能投资多家企 业。当将多个数据源中的信息提取出来时进行关联分析时,自然人身份的唯一性识别就变 得非常重要,比如说在绘制企业关联图谱时,如果不能判断不同企业信息的自然人是同一 个人,则不会将图谱进行合并,不能建立起不同企业间的事实关联关系。在不确定同名的两 个人是同一个人的情况下,贸然将不同的数据进行合并,则可能产生关联网络构建的错误。 在确定相同姓名企业相关自然人为同一人的基础上,如何对已经识别出的同名自 然人进行重新标识,来保证在不暴露、或依赖身份证等隐私信息前提下,实现同一目标标识 的唯一性是构建高质量图谱的基础;虽然对已识别出的同一自然人数据赋予唯一ID是目前 解决这一问题的办法;但是,不同的数据使用者的唯一ID的产生规则不同,且可能随时进行 变更;导致数据更新或者多源数据融合时自然人的唯一ID大范围变化,当数据量很大时,大 范围的ID变化将造成非常大的计算量和重置成本。 怎么能保持同一企业自然人唯一ID不会随着数据更新而随意改变,保持数据标识 的唯一性、稳定性;进而使得数据易于扩展、易于和不同数据源进行交互非常重要。
技术实现要素:
本发明的目的提供自然人ID创建方法、存储介质、电子设备及系统,保证在不暴 露、或依赖身份证等隐私信息前提下,实现同一自然人重新标识的并满足唯一性,稳定性; 保障数据更新、多源数据融合以及数据集成时企业自然人实体数据的ID保持相对稳定一 致,从而保证企业知识图谱构建的效率和质量。 自然人ID创建方法,包含以下实现步骤: 将属于同一自然人的数据编入一个数据组,所述数据中包含自然人姓名和企业名信 息; 对数据组中的各条数据,使用包含自然人姓名和企业名的信息来重新编码; 对获得的编码使用已设置的规则进行排序,选出一个编码作为该数据组的组编码; 将所述组编码赋予到组内的各条数据中,作为对应自然人的新ID。 作为一种优选,所述步骤对数据组内的各条数据使用包含自然人姓名和企业名的 信息来重新编码中,编码算法为hash算法。 作为一种优选,所述步骤对数据组内的各条数据使用包含自然人姓名和企业名的 信息来重新编码中,编码算法为md5。 进一步的,所述步骤对数据组内的各条数据使用包含自然人姓名和企业名的信息 3 CN 111597344 A 说 明 书 2/6 页 来重新编码中,使用包含自然人姓名标识、自然人姓名、企业名标识和企业名的信息来进行 编码。 进一步的,所述步骤将属于同一自然人的记录数据编入一个数据组,所述记录数 据中自然人姓名和企业名信息中,所述数据中还包含企业注册资本信息。 作为一种优选,所述步骤对获得的编码使用已设置的规则进行排序,选出一个编 码作为对应数据组的组编码; 作为一种优选,所述步骤将组编码赋予到组内的各条数据中,作为对应自然人的新ID 中,将注册资本最高的企业的编码作为对应数据组的组编码。 进一步的,本发明方法还包含步骤:将更新ID后的数据保存到数据库。 进一步的,本发明提供一种电子设备,所述的设备包括:存储器,存储程序指令;处 理器与所述存储器相连接;执行存储器中的程序指令,实现所述自然人ID创建方法中的步 骤。 进一步的,本发明提供一种计算机可读指令的计算机可读存储介质,所述计算可 读指令在被执行时,使处理器执行所述自然人ID创建方法中的操作。 进一步的,本发明提供一种自然人ID构建系统,所述系统使用所述自然人ID创建 方法来构建自然人ID。 进一步的,本发明还提供一种自然人ID更新方法,数据更新时使用如使用所述自 然人ID创建方法来更新自然人的ID。 有益效果: 本发明提供自然人ID创建方法、存储介质、电子设备及系统;本发明对同一初始ID的企 业自然人数据,使用自然人姓名加企业名的方式进行重新编码,保证了在数据更新或者数 据融合时,自然人ID不随意变动。在不泄露个人身份证号码的前提下对自然人重新编码标 识,保证了相同自然人实体识别的结果的唯一性;为企业知识图谱的构建提供非常可靠的 数据基础。并且本发明可使用自然人姓名标识、自然人姓名、企业名标识和企业名的信息来 进行编码,结合编码算法的基础上,可实现编码字段的加密,保证数据安全,方便多方数据 集成和联合分析。 本发明还提供自然人ID更新方法,在保持自然人ID稳定的基础上实现了自然人ID 的动态变化,保障数据的时效性。 附图说明 为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附 图作简单地介绍,  应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是 对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 这些附图获得其他相关的附图。 图1为自然人ID创建方法的流程示意图。 图2为本发明系统结构示意图。
分享到:
收藏