logo好方法网

一种计算机大数据存储系统、方法及存储介质


技术摘要:
本发明涉及一种计算机大数据存储系统及方法,包括以下:步骤401、获取需要进行存储的数据组,将所述数据组通过计算划分为异常数据组以及正常数据组;步骤402、获取需要进行存储的数据组的关键词信息,根据所述关键词信息判断所述数据组的加密等级;步骤403、根据得到的  全部
背景技术:
在进行大数据分析时,往往需要大量的相关数据来进行辅助分析,因为网络上的 数据往往多而杂,临时去网上搜寻显然是不合适的。 当今市场的用于大数据分析使用的数据存储方法往往为以下两种情况: 1、由于存储的方式过于简单,导致在使用该数据进行分析时需要进行较长时间的 数据预处理,十分的麻烦; 2、由于存储的方式过于复杂,导致在构件存储系统时需要花费高昂的成本,对数 据需求精度不高的分析来说,有些浪费。
技术实现要素:
本发明的目的是解决现有技术的不足之一,提供一种计算机大数据存储系统、方 法及存储介质。 为了实现上述目的,本发明采用以下的技术方案: 提出一种计算机大数据存储系统,包括: 数据信息获取模块,用于获取需要进行存储的数据组; 数据组划分模块,用于将数据组通过计算划分为异常数据组以及正常数据组; 关键词信息获取模块,用于获取需要进行存储的数据组的关键词信息; 加密等级计算模块,用于根据所述关键词信息判断所述数据组的加密等级; 云端服务器,包括至少三组云端加密盘,所述云端加密盘为独立的数据存储空间, 所述云端加密盘的安全级别设置有3级, 第一级,为最低安全等级,在用户进行访问时,需要完成云端服务器的注册账户验 证, 第二级,为中间安全等级,在用户进行访问时,需要完成云端服务器的注册账户验 证以及用户的身份识别码验证, 第三级,为最高安全等级,在用户进行访问时,需要完成云端服务器的注册账户验 证、用户的身份识别码验证以及用户的人脸信息验证; 数据写入模块,用于根据对应得到的所述加密等级,将划分得到的异常数据组以 及正常数据组存储至对应安全级别的云端加密盘中。 进一步,所述云端服务器还包括, 信息注册模块,用于辅助用户完成信息注册; 身份识别码验证模块,用于辅助用户完成身份识别码验证; 人脸识别验证模块,用于辅助用户完成人脸识别验证。 4 CN 111581209 A 说 明 书 2/5 页 进一步,所述云端服务器还包括, 身份识别码生成模块,用于通过获取用户的身份证后4位数字得到或根据用户的 身份证后4位数字加密得到用户的身份识别码。 本发明还提出一种计算机大数据存储方法,其特征在于,包括以下: 步骤401、获取需要进行存储的数据组{T1、T2、T3…Tn},将所述数据组{T1、T2、 T3…Tn}通过计算划分为异常数据组以及正常数据组; 步骤402、获取需要进行存储的数据组{T1、T2、T3…Tn}的关键词信息,根据所述关 键词信息判断所述数据组{T1、T2、T3…Tn}的加密等级; 步骤403、根据得到的所述加密等级,将划分得到的异常数据组以及正常数据组存 储至对应安全级别的云端加密盘中,所述云端加密盘为独立的数据存储空间, 所述云端加密盘的安全级别设置有3级, 第一级,为最低安全等级,在用户进行访问时,需要完成云端服务器的注册账户验 证, 第二级,为中间安全等级,在用户进行访问时,需要完成云端服务器的注册账户验 证以及用户的身份识别码验证, 第三级,为最高安全等级,在用户进行访问时,需要完成云端服务器的注册账户验 证、用户的身份识别码验证以及用户的人脸信息验证。 进一步,上述步骤401中的将所述数据组{T1、T2、T3…Tn}通过计算划分为异常数 据组以及正常数据组的操作具体包括以下: 步骤501、计算所述数据组{T1、T2、T3…Tn}的平均值 步骤502、根据所述平均值 计算所述数据组的每个数据所对应的样本标准差sTi, 步骤503、判断所述数据组的每个数据所对应的样本标准差sTi是否大于第一阈值, 若是则将该数据归于正常数据组中,若否则将该数据归于异常数据组中。 进一步,上述步骤402中获取需要进行存储的数据组{T1、T2、T3…Tn}的关键词信 息的方式具体包括以下,通过在用户输入所述数据组{T1、T2、T3…Tn}时选择的关键词标签 得到所述数据组{T1、T2、T3…Tn}的关键词信息。 进一步,上述步骤402中根据所述关键词信息判断所述数据组{T1、T2、T3…Tn}的 加密等级具体包括以下: 将所述关键词信息与加密等级数据库中的词条信息进行比对得到所述数据组 {T1、T2、T3…Tn}的加密等级,所述加密等级数据库包括三个表,三个所述表分别对应存储 有所述云端加密盘的三个安全级别对应的关键词信息。 进一步,上述步骤403中用户的身份识别码通过直接获取用户的身份证后4位数字 得到或根据用户的身份证后4位数字加密得到,在用户完成账户注册时根据用户填写的联 系方式发送给用户。 进一步,所述第一阈值为1.96。 本发明还提出一种计算机可读存储的介质,所述计算机可读存储的介质存储有计 5 CN 111581209 A 说 明 书 3/5 页 算机程序,其特征在于,所述计算机程序被处理器执行时实现任一项所述计算机大数据存 储方法的步骤。 本发明的有益效果为: 本发明在采用上述的系统以及方法时能够获得以下有益效果: 本发明提供了一种计算机大数据存储系统、方法及存储介质,能够通过在数据存 储时对数据进行异常筛选,方便后续的分析,并根据数据的优先级设置访问权限,针对性地 保护了数据的安全,总体而言,对数据进行了一定的预处理以及数据分级保护,性价比较 高。 附图说明 图1所示为本发明一种计算机大数据存储方法流程图。
分享到:
收藏