
技术摘要:
本申请揭示了一种告警根因的定位方法、装置、计算机设备和存储介质,获取告警切片中的特定告警对象,并生成对应的告警簇;对告警簇中的指定告警对象中的监控指标进行指标聚合处理,生成入口指标;获取与指定告警对象对应的第一指标时序数据,以及获取与指定告警对象对 全部
背景技术:
随着科学技术的快速发展,当前信息化时代的业务场景日新月异,频繁的业务功 能更新和配置参数变更,都会导致层出不穷的异常告警,从而导致安全隐患和潜在损失。在 运维系统中,某对象所产生的故障可能引发多个对象的告警,而每一时刻可能存在多个对 象故障所引发的大量关联告警。因此,如何在运维系统发生异常告警时,迅速定位异常告警 的根因(Root Cause,根本原因)以及时止损,就成为亟待解决的问题。现有的定位告警根因 的方式需要由运维人员时刻关注运维系统,然后对某时刻的告警对象进行切分以归纳为不 同的问题,并对于每一个问题进行根因分析以判定故障对象,运维人员的工作量大,运维工 作的耗时较长,运维工作效率低。
技术实现要素:
本申请的主要目的为提供一种告警根因的定位方法、装置、计算机设备和存储介 质,旨在解决现有的定位告警根因的方式需要由运维人员时刻关注运维系统,然后对某时 刻的告警对象进行切分以归纳为不同的问题,并对于每一个问题进行根因分析以判定故障 对象,运维人员的工作量大,运维工作的耗时较长,运维工作效率低的技术问题。 本申请提出一种告警根因的定位方法,所述方法包括步骤: 获取告警切片中的特定告警对象,并根据所述特定告警对象生成告警簇,其中,所 述特定告警对象为所述告警切片中所有的告警对象内的任意一个告警对象; 获取所述告警簇中的指定告警对象,并对所述指定告警对象中的监控指标进行指 标聚合处理,生成对应的入口指标,其中,所述指定告警对象为所述告警簇中所有的告警对 象内的任意一个告警对象; 获取与所述指定告警对象的指定指标对应的第一指标时序数据,以及获取与所述 指定告警对象的入口指标对应的第二指标时序数据; 根据所述第二指标时序数据的第二时间窗口,按照第一预设规则对所述第一指标 时序数据的第一时间窗口进行调整,并计算出所述指定指标与所述入口指标之间的指定皮 尔逊相似度; 分别获取每一个所述指定告警对象对应的指定皮尔逊相似度,以及与每一个所述 指定皮尔逊相似度分别对应的指定时间差; 根据所有所述指定皮尔逊相似度以及每一个所述指定皮尔逊相似度分别对应的 指定时间差,按照第二预设规则从所有所述指定告警对象中筛选出至少一个指定告警对象 作为所述告警簇的根因对象,并输出所述告警簇的根因对象。 可选地,所述获取告警切片中的特定告警对象,并根据所述特定告警对象生成告 5 CN 111555921 A 说 明 书 2/15 页 警簇的步骤,包括: 获取告警切片中的特定告警对象; 分别计算所述告警切片中除所述特定告警对象外的每一个告警对象与所述特定 告警对象之间的调用链距离; 循环执行从所述告警切片中筛选出与所述特定告警对象之间的调用链距离不大 于预设距离阈值的目标告警对象的步骤,直至在所述告警切片中不存在与所述特定告警对 象之间的调用链距离不大于预设距离阈值的目标告警对象; 将筛选得到的所有所述目标告警对象与所述特定告警对象放置于预设的告警集 合内,得到所述告警簇。 可选地,所述根据所述第二指标时序数据的第二时间窗口,按照第一预设规则对 所述第一指标时序数据的第一时间窗口进行调整,并计算出所述指定指标与所述入口指标 之间的指定皮尔逊相似度的步骤,包括: 获取第一指标时序数据的第一时间窗口,以及所述第二指标时序数据的第二时间 窗口; 根据所述第二时间窗口与预设的时间差阈值,对所述第一时间窗口进行滑动调 整,以控制所述第一时间窗口与所述第二时间窗口的时间差在所述时间差阈值的范围之 内,并得到经过滑动调整后的多组指定第一时间窗口; 根据多组所述指定第一时间窗口,计算出与多组所述指定第一时间窗口分别对应 的,多组所述指定指标与所述入口指标之间的皮尔逊相似度; 从所述多组皮尔逊相似度中筛选出数值最大的皮尔逊相似度; 将所述数值最大的皮尔逊相似度确定为所述指定皮尔逊相似度。 可选地,所述根据所述第二指标时序数据的第二时间窗口,按照第一预设规则对 所述第一指标时序数据的第一时间窗口进行调整,并计算出所述指定指标与所述入口指标 之间的指定皮尔逊相似度的步骤,包括: 获取第一指标时序数据的第一时间窗口,以及所述第二指标时序数据的第二时间 窗口; 根据所述第二时间窗口与预设的时间差阈值,对所述第一时间窗口进行滑动调 整,以控制所述第一时间窗口与所述第二时间窗口的时间差在所述时间差阈值的范围之 内,并得到经过滑动调整后的多组指定第一时间窗口; 根据多组所述指定第一时间窗口,计算出与多组所述指定第一时间窗口分别对应 的,多组所述指定指标与所述入口指标之间的皮尔逊相似度; 从所述多组皮尔逊相似度中筛选出数值最大的皮尔逊相似度; 将所述数值最大的皮尔逊相似度确定为所述指定皮尔逊相似度。 可选地,所述将所述根因判断概率值最高的至少一个指定告警对象作为所述告警 簇的根因对象,并输出所述告警簇的根因对象的步骤,包括: 将所有所述根因判断概率值按照从高到低的顺序进行排序,得到排序结果; 从所述排序结果中排在首位的根因判断概率值开始,依次获取预设数量的指定根 因判断概率值; 将与获取到的所述指定根因判断概率值对应的告警对象作为所述告警簇的根因 6 CN 111555921 A 说 明 书 3/15 页 对象。 可选地,所述根据所有所述指定皮尔逊相似度以及每一个所述指定皮尔逊相似度 分别对应的指定时间差,按照第二预设规则从所有所述指定告警对象中筛选出至少一个指 定告警对象作为所述告警簇的根因对象,并输出所述告警簇的根因对象的步骤,包括: 基于历史告警数据计算与所述指定皮尔逊相似度对应的第一权重值; 获取与所述指定时间差对应的第二权重值; 根据所述第一权重值与所述第二权重值,对每一个所述指定皮尔逊相似度与相对 应的每一个指定时间差进行加权计算,得到多个加权值; 将加权值最高的至少一个指定告警对象作为所述告警簇的根因对象,并输出所述 告警簇的根因对象。 可选地,所述根据所有所述指定皮尔逊相似度以及每一个所述指定皮尔逊相似度 分别对应的指定时间差,按照第二预设规则从所有所述指定告警对象中筛选出至少一个指 定告警对象作为所述告警簇的根因对象,并输出所述告警簇的根因对象的步骤之后,包括: 展示所述告警簇的根因对象; 接收运维人员从所述告警簇的根因对象中选择的指定根因对象; 将所述指定根因对象确定为所述告警簇的最终根因对象。 本申请还提供一种告警根因的定位装置,包括: 第一获取模块,用于获取告警切片中的特定告警对象,并根据所述特定告警对象 生成告警簇,其中,所述特定告警对象为所述告警切片中所有的告警对象内的任意一个告 警对象; 生成模块,用于获取所述告警簇中的指定告警对象,并对所述指定告警对象中的 监控指标进行指标聚合处理,生成对应的入口指标,其中,所述指定告警对象为所述告警簇 中所有的告警对象内的任意一个告警对象; 第二获取模块,用于获取与所述指定告警对象的指定指标对应的第一指标时序数 据,以及获取与所述指定告警对象的入口指标对应的第二指标时序数据; 调整模块,用于根据所述第二指标时序数据的第二时间窗口,按照第一预设规则 对所述第一指标时序数据的第一时间窗口进行调整,并计算出所述指定指标与所述入口指 标之间的指定皮尔逊相似度; 第三获取模块,用于分别获取每一个所述指定告警对象对应的指定皮尔逊相似 度,以及与每一个所述指定皮尔逊相似度分别对应的指定时间差; 第一确定模块,用于根据所有所述指定皮尔逊相似度以及每一个所述指定皮尔逊 相似度分别对应的指定时间差,按照第二预设规则从所有所述指定告警对象中筛选出至少 一个指定告警对象作为所述告警簇的根因对象,并输出所述告警簇的根因对象。 本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算 机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。 本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程 序被处理器执行时实现上述方法的步骤。 本申请中提供的告警根因的定位方法、装置、计算机设备和存储介质,具有以下有 益效果: 7 CN 111555921 A 说 明 书 4/15 页 本申请中提供的告警根因的定位方法、装置、计算机设备和存储介质,获取告警切 片中的特定告警对象,并根据所述特定告警对象生成告警簇,其中,所述特定告警对象为所 述告警切片中所有的告警对象内的任意一个告警对象;获取所述告警簇中的指定告警对 象,并对所述指定告警对象中的监控指标进行指标聚合处理,生成对应的入口指标,其中, 所述指定告警对象为所述告警簇中所有的告警对象内的任意一个告警对象;获取与所述指 定告警对象的指定指标对应的第一指标时序数据,以及获取与所述指定告警对象的入口指 标对应的第二指标时序数据;根据所述第二指标时序数据的第二时间窗口,按照第一预设 规则对所述第一指标时序数据的第一时间窗口进行调整,并计算出所述指定指标与所述入 口指标之间的指定皮尔逊相似度;分别获取每一个所述指定告警对象对应的指定皮尔逊相 似度,以及与每一个所述指定皮尔逊相似度分别对应的指定时间差;根据所有所述指定皮 尔逊相似度以及每一个所述指定皮尔逊相似度分别对应的指定时间差,按照第二预设规则 从所有所述指定告警对象中筛选出至少一个指定告警对象作为所述告警簇的根因对象,并 输出所述告警簇的根因对象。本申请通过对告警对象进行聚类与根因分析,从而能够快速 智能地生成与告警对象对应的告警簇相关的根因对象,有效的避免出现需要人工时刻在与 运维系统相关的大量原始数据中进行根因分析的情况,减轻了运维人员的工作量,降低了 告警根因判断过程所需的耗时,提高了运维工作的工作效率。 附图说明 图1是本申请一实施例的告警根因的定位方法的流程示意图; 图2是本申请一实施例的告警根因的定位装置的结构示意图; 图3是本申请一实施例的计算机设备的结构示意图。 本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。