logo好方法网

一种自动分析指标口径的方法、系统和装置


技术摘要:
本发明公开了一种自动分析指标口径的方法、系统和装置,属于大数据处理领域;所述的方法先按照S1获取指标执行逻辑,通过S2对S1获取的执行逻辑进行循环判断、分析生成sql组,按照S3对sql组进行递归分析,首先分析第一层,获取sql的条件部分where和数据来源部分from,通  全部
背景技术:
大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V,数据量大 (Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。大数据 作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等 等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代 的来临,大数据分析也应运而生; 统计口径是指统计数据所采用的标准,即进行数据的统计工作所依照的指标体 系,统计口径包括统计方式、统计范围等指标; 对于指标口径来说,目前都是通过人工配置实现,没有一种自动解析的方法去自 动解析,使用者无法直观观察到指标口径及其内在关系,工作效率较低,故现发明一种自动 分析指标口径的方法、系统和装置,已解决上述问题。
技术实现要素:
本发明针对现有技术的问题,提供一种自动分析指标口径的方法、系统和装置,所 采用的技术方案为: 一种自动分析指标口径的方法,所述的方法具体步骤如下: S1获取指标执行逻辑; S2对执行逻辑循环判断分析生成sql组; S3对sql组进行递归分析,获取sql组的条件部分where和数据来源部分from; S4对where部分解析获取单个条件的组W,对from部分解析获得单个表的组B; S5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系; S6将分析结果进行汇总,并存储为结构化数据; S7利用画图插件D3将分析得到的数据进行图像化展示,供客户查看指标口径。 所述S2对执行逻辑循环判断分析生成sql组的具体步骤包括: S201判断执行逻辑是否为存储过程; S202是,则将执行逻辑记为Sql1; S212否,则解析出其中的相关插入sql,记为Sql1、Sql2......Sqln; S203将Sql1、Sql2......Sqln组成sql组进行循环分析。 所述S5对组W进行循环分析,得到每个条件的字段信息及其其中的关联关系的具 体步骤包括; S501将得到为1个字段Z1的条件从组B中找到对应的表Bn, S511将得到为n个字段Z1…Zn的条件从组B中找到对应的表B1...Bn,并对其记进 4 CN 111611248 A 说 明 书 2/6 页 行去重,得到B1…Bm(m<=n); S502利用递归临时表LBn从数据库中找到字段来源的真实物理表; S503利用真实物理表得到相应的口径,并递归分析临时表LBn的所有口径。 所述S511将得到为n个字段Z1…Zn的条件从组B中找到对应的表B1...Bn,并对其 记进行去重,得到B1…Bm(m<=n)的具体步骤包括: S521当组B中表B1…Bm中的m等于1,对Z1…Zn进行循环,每个字段按照S501进行分 析; S531当组B中表B1…Bm中的m>1,对字段Z1…Zn分别按照S501进行处理汇总,得到 B1…Bm的一个关联口径。 所述S7利用画图插件D3将分析得到的数据进行图像化展示,其展示把表显示为节 点,通过连线展示表与表之间的关系,其具体步骤包括: S701表独有的口径,直接显示在表的详细信息中; S711表和表的关联口径,则直接显示的表与表之间的连线上。 一种自动分析指标口径的系统,所述的系统包括获取模块、判断生成模块、递归分 析模块、分步解析模块、字段关联模块、汇总存储模块和图像展示模块; 获取模块获取指标执行逻辑; 判断生成模块对执行逻辑循环判断分析生成sql组; 递归分析模块对sql组进行递归分析,获取sql组的条件部分where和数据来源部 分from; 分步解析模块对where部分解析获取单个条件的组W,对from部分解析获得单个表 的组B; 字段关联模块对组W进行循环分析,得到每个条件的字段信息及其其中的关联关 系; 汇总存储模块将分析结果进行汇总,并存储为结构化数据; 图像展示模块利用画图插件D3将分析得到的数据进行图像化展示,供客户查看指 标口径。 所述判断生成模块还包括逻辑判断模块、第一标记模块、第二标记模块和循环分 析模块: 逻辑判断模块:判断执行逻辑是否为存储过程; 第一标记模块:逻辑判断模块判断为是时,将执行逻辑记为Sql1; 第二标记模块:逻辑判断模块判断为否时,解析出其中的相关插入sql,记为Sql1、 Sql2......Sqln; 循环分析模块:将Sql1、Sql2......Sqln组成sql组进行循环分析。 所述字段关联模块还包括单字段模块、多字段模块、来源分析模块和口径分析模 块; 单字段模块:将得到为1个字段Z1的条件从组B中找到对应的表Bn, 多字段模块:将得到为n个字段Z1…Zn的条件从组B中找到对应的表B1...Bn,并对 其记进行去重,得到B1…Bm(m<=n); 来源分析模块:利用递归临时表LBn从数据库中找到字段来源的真实物理表; 5 CN 111611248 A 说 明 书 3/6 页 口径分析模块:利用真实物理表得到相应的口径,并递归分析临时表LBn的所有口 径。 所述多字段模块还包括分类循环模块A和分类循环模块B; 当组B中表B1…Bm中的m等于1,分类循环模块A对Z1…Zn进行循环,每个字段按照 单字段模块进行分析 当组B中表B1…Bm中的m>1,分类循环模块B对字段Z1…Zn分别按照单子弹模块进 行处理汇总,得到B1…Bm的一个关联口径。 一种自动分析指标口径装置,包括存储器和处理器; 所述存储器,用于存储计算机程序; 所述处理器,用于当执行所述计算机程序时,实现如权利要求1-4任一项所述的自 动分析指标口径的方法。 本发明的有益效果为:本发明方法先按照S1获取指标执行逻辑,通过S2对S1获取 的执行逻辑进行循环判断、分析生成sql组,按照S3对sql组进行递归分析,首先分析第一 层,获取sql的条件部分where和数据来源部分from,通过S4对sql的条件部分进行解析,获 取单个条件的组W,对sql的数据来源from部分进行解析,获得单个表的组B,S5对组W进行循 环分析,得到每个条件的字段信息及其其中的关联关系,在通过S6将分析结果进行汇总,并 存储为结构化数据,最后按照S7通过画图插件D3将分析等到的数据图形化的展示在页面 上,供客户查看指标口径;解决自动分析指标sql获取指标口径的问题的同时,能够图形化 展示指标口径及其内在关系,节省人力资源的使用,提高数据分析指标口径的工作效率。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以 根据这些附图获得其他的附图。 图1是本发明方法的流程示意图;图2是本发明方法的步骤示意图;图3是本发明系 统的结构示意图;图4是本发明装置的结构示意图。
分享到:
收藏