logo好方法网

基于大数据平台的数据共享方法、装置及政企云平台


技术摘要:
本发明涉及数据处理技术领域,具体而言,提供了一种基于大数据平台的数据共享方法、装置及政企云平台。详细地,本发明所提供的基于大数据平台的数据共享方法、装置及政企云平台一方面能够主动地检测数据更新信息和企业端服务器的更新情况,确保企业端服务器获取目标共  全部
背景技术:
大数据的发展为企业提供了项目申报和评估的便利。企业可以通过政企数据云平 台进行项目申报信息的查询和数据咨询。一般而言,一个政企数据云平台会对接多个企业。 常见的政企云平台的运作方式是根据每个企业端发送的数据咨询请求查找出对应的数据 咨询结果然后返回给企业端,当多个企业端发送的数据咨询请求相同或相似时,政企云平 台服务器会将相同的数据咨询结果共享给这些企业端。但这种方法存在以下缺点: (1)由于政企云平台是接收到企业端发送的数据咨询请求后才返回数据咨询结果,数 据咨询结果的生成时刻可能早于企业端发送数据咨询请求的时刻,在这种情况下,使得企 业端无法在数据咨询请求生成时及时获取数据咨询请求。无法确保企业端获取数据咨询结 果的时效性。 (2)政企云平台在共享数据咨询结果时是根据数据咨询请求直接进行的,存在共 享数据咨询结果时的针对性不强。
技术实现要素:
为了至少克服现有技术中的上述不足,本发明的目的之一在于提供一种基于大数 据平台的数据共享方法、装置及政企云平台。 本发明实施例的第一方面,提供了一种基于大数据平台的数据共享方法,应用于 与多个企业端服务器通信的政企云平台,所述政企云平台预存有每个企业端服务器的初始 用户画像信息,所述政企云平台中设置有咨询数据库,所述方法包括: 检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存在所述数据更新 信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数据; 针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数据库存在所述数 据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新操作;在该企业端 服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止时刻之前的设定 时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对预存的该企业端 服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画像信息; 基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企 业端服务器之间的竞争关系; 根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息确定出每个企 业端服务器与所述目标数据的匹配度; 基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库中对所述目标数 据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根据所述关联性处 6 CN 111581226 A 说 明 书 2/14 页 理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共享数据进行发送。 在一种可替换的实施方式中,所述基于每个企业端服务器对应的初始用户画像信 息或实时用户画像信息确定出每个企业端服务器之间的竞争关系,包括: 针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业 端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像 信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第 二实时用户画像信息对应的第二画像特征向量; 判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维 度是否相同; 在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的 第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二 企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征 向量; 在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的 第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所 述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影 响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目 标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量 进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影 响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目 标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量 进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所 述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分 别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向 量和所述第二目标特征向量; 针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出 与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值 之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时 用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像 信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第 一企业端服务器和所述第二企业端服务器之间的竞争关系。 在一种可替换的实施方式中,所述根据每个企业端服务器对应的初始用户画像信 息或实时用户画像信息确定出每个企业端服务器与所述目标数据的匹配度,包括: 从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一 关键词和每个第一关键词的第一词向量; 从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获 得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二 关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值; 根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似 7 CN 111581226 A 说 明 书 3/14 页 度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量; 确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每 个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服 务器与所述目标数据的匹配度。 在一种可替换的实施方式中,所述基于每个企业端服务器对应的竞争关系和匹配 度,在所述咨询数据库中对所述目标数据进行关联性处理,得到与每个企业端服务器对应 的关联性处理结果,包括: 确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目 标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类 别数据; 确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关 联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对 应的历史数据中的标识数据存在一致性的数据; 针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数 确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数 据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数; 针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述 目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二 关联性数据确定出与该企业端服务器对应的关联性处理结果。 本发明实施例的第二方面,提供了一种基于大数据平台的数据共享装置,应用于 与多个企业端服务器通信的政企云平台,所述政企云平台预存有每个企业端服务器的初始 用户画像信息,所述政企云平台中设置有咨询数据库,所述装置包括: 检测模块,用于检测所述咨询数据库存在数据更新信息;在检测到所述咨询数据库存 在所述数据更新信息时,根据所述数据更新信息获取所述咨询数据库中所更新的目标数 据; 判断模块,用于针对每个企业端服务器,判断该企业端服务器在以检测到所述咨询数 据库存在所述数据更新信息的时刻为终止时刻之前的设定时长内是否存在企业信息更新 操作;在该企业端服务器在以检测到所述咨询数据库存在所述数据更新信息的时刻为终止 时刻之前的设定时长内是否存在所述企业信息更新操作时,根据所述企业信息更新操作对 预存的该企业端服务器的初始用户画像信息进行更新,得到该企业端服务器的实时用户画 像信息; 确定模块,用于基于每个企业端服务器对应的初始用户画像信息或实时用户画像信息 确定出每个企业端服务器之间的竞争关系; 匹配模块,用于根据每个企业端服务器对应的初始用户画像信息或实时用户画像信息 确定出每个企业端服务器与所述目标数据的匹配度; 发送模块,用于基于每个企业端服务器对应的竞争关系和匹配度,在所述咨询数据库 中对所述目标数据进行关联性处理,得到与每个企业端服务器对应的关联性处理结果;根 据所述关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将所述目标共 享数据进行发送。 8 CN 111581226 A 说 明 书 4/14 页 在一种可替换的实施方式中,所述确定模块,用于: 针对与所述政企云平台通信的多个企业端服务器中的第一企业端服务器和第二企业 端服务器,分别提取所述第一企业端服务器的第一初始用户画像信息或第一实时用户画像 信息对应的第一画像特征向量以及所述第二企业端服务器的第二初始用户画像信息或第 二实时用户画像信息对应的第二画像特征向量; 判断所述第一画像特征向量的第一向量维度与所述第二画像特征向量的第二向量维 度是否相同; 在所述第一向量维度与所述第二向量维度相同时,根据所述第一企业端服务器对应的 第一企业类型对所述第一画像特征向量进行加权得到第一目标特征向量并根据所述第二 企业端服务器对应的第二企业类型对所述第二画像特征向量进行加权得到第二目标特征 向量; 在所述第一向量维度和所述第二向量维度不相同时,确定出所述第一企业端服务器的 第一影响因子以及所述第二企业端服务器的第二影响因子;确定出所述第一影响因子和所 述第二影响因子之间的比较结果;在所述比较结果表征所述第一影响因子大于所述第二影 响因子时,以所述第一向量维度为基准对所述第二画像特征向量进行维度调整得到第二目 标特征向量并根据所述第一企业端服务器对应的第一企业类型对所述第一画像特征向量 进行加权得到第一目标特征向量;在所述比较结果表征所述第一影响因子小于所述第二影 响因子时,以所述第二向量维度为基准对所述第一画像特征向量进行维度调整得到第一目 标特征向量并根据所述第二企业端服务器对应的第二企业类型对所述第二画像特征向量 进行加权得到第二目标特征向量;在所述第一影响因子等于所述第二影响因子时,根据所 述第一向量维度和所述第二向量维度确定出第三向量维度;以所述第三向量维度为基准分 别对所述第一画像特征向量和所述第二画像特征向量进行维度调整得到第一目标特征向 量和所述第二目标特征向量; 针对所述第一目标特征向量中的每个第一向量值,从所述第二目标特征向量中确定出 与该第一向量值存在对应关系的第二向量值;确定每个第一向量值及其对应的第二向量值 之间的相似度比对结果;根据所述第一企业端服务器的第一初始用户画像信息或第一实时 用户画像信息以及所述第二企业端服务器的第二初始用户画像信息或第二实时用户画像 信息对确定出的相似度比对结果进行聚类,并基于聚类得到的相似度比对结果得到所述第 一企业端服务器和所述第二企业端服务器之间的竞争关系。 在一种可替换的实施方式中,所述匹配模块,用于: 从每个企业端服务器对应的初始用户画像信息或实时用户画像信息中提取多个第一 关键词和每个第一关键词的第一词向量; 从所述多个第一关键词中筛选出多个与第二关键词存在词向量引申关系的关键词,获 得多个第三关键词,所述第二关键词为所述目标数据中的文字信息中的关键词,所述第二 关键词的第二词向量与所述第一关键词的第一词向量之间的相似度小于设定阈值; 根据所述多个第三关键词的第三词向量和所述第二关键词的第二词向量之间的相似 度对每个第一关键词的第一词向量进行调整,得到每个第一关键词对应的目标词向量; 确定出每个目标词向量与所述第二关键词的第二词向量之间的目标相似度并根据每 个目标相似度对应的第一关键词的关键词类别以及每个目标相似度确定出每个企业端服 9 CN 111581226 A 说 明 书 5/14 页 务器与所述目标数据的匹配度。 在一种可替换的实施方式中,所述发送模块,用于: 确定基于每个企业端服务器对应的竞争关系从所述咨询数据库中查询出的与所述目 标数据对应的第一关联性数据;其中,所述第一关联性数据为所述目标数据对应的企业类 别数据; 确定基于每个企业服务器对应的匹配度从所述咨询数据库中查询出的与所述第一关 联性数据对应的第二关联性数据;其中,所述第二关联性数据是与所述第一关联性数据对 应的历史数据中的标识数据存在一致性的数据; 针对所述第二关联性数据,基于所述第二关联性数据在所述咨询数据库中的调用次数 确定出所述第二关联性数据的活跃度;针对所述第一关联性数据,基于所述第一关联性数 据在所述咨询数据库中的存储累计时长确定出所述第一关联性数据的稳定系数; 针对每个企业端服务器,根据与该企业端服务器对应的活跃度和稳定系数确定出所述 目标数据的关联性索引策略并根据所述关联性索引策略、所述第一关联性数据和所述第二 关联性数据确定出与该企业端服务器对应的关联性处理结果。 本发明实施例的第三方面,提供了一种政企云平台,包括处理器以及与所述处理 器连接的存储器和总线;其中,所述处理器和所述存储器通过所述总线完成相互间的通信; 所述处理器用于调用所述存储器中的程序指令,以执行上述的基于大数据平台的数据共享 方法。 本发明实施例的第四方面,提供了一种可读存储介质,其上存储有程序,该程序被 处理器执行时实现上述的基于大数据平台的数据共享方法。 本发明实施例所提供的一种基于大数据平台的数据共享方法、装置及政企云平 台,政企云平台能够实时检咨询数据库的数据更新情况以及每个企业端服务器的企业信息 更新情况,并实时获取每个企业端服务器对应的用户画像信息,从而确定出每个企业端服 务器之间的竞争关系并确定出每个企业端服务器与目标数据的匹配度,进而实现根据每个 企业端服务器对应的竞争关系和匹配度对目标数据针对性的关联性处理,然后根据每个企 业端服务器对应的关联性处理结果确定出与每个企业端服务器对应的目标共享数据并将 目标共享数据进行发送。如此,一方面能够主动地检测数据更新信息和企业端服务器的更 新情况,确保企业端服务器获取目标共享数据的时效性。另一方面,向每个企业端服务器发 送的目标共享数据是根据每个企业端服务器对应的竞争关系和匹配度在咨询数据库中对 目标数据进行关联性处理得到的,实现了针对不同的企业端服务器的针对性和差异性数据 共享。 附图说明 为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附 图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对 范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这 些附图获得其他相关的附图。 图1为本发明实施例所提供的一种基于大数据平台的数据共享方法的流程图。 图2为本发明实施例所提供的一种基于大数据平台的数据共享装置的功能模块框 10 CN 111581226 A 说 明 书 6/14 页 图。 图3为本发明实施例所提供的一种政企云平台的方框示意图。 图标: 200-基于大数据平台的数据共享装置;201-检测模块;202-判断模块;203-确定模块; 204-匹配模块;205-发送模块; 300-政企云平台;301-处理器;302-存储器;303-总线。
分享到:
收藏