
技术摘要:
本发明公开了一种基于AI技术的智慧运维知识分析方法,包括如下步骤:S1、通过检测系统实时检测设备运行状态和负载数据,当设备运行发生故障或负载过大时,将故障信号收集并传输至AI分析引擎;S2、通过AI分析引擎对故障信号进行解析分析,并根据解析结果与知识库内的运 全部
背景技术:
运维,通常指互联网运维,属于技术部门,本质上是对网络、服务器、服务的生命周 期各个阶段的运营与维护,在成本、稳定性、效率上达成一致可接受的状态,目前的运维方 式都是通过运维人员发现服务的运行异常和资源消耗情况后,人工进行分析和处理,在运 维管理中,常常会出现许多重复的故障,这些故障可以通过固定的处理方案进行处理,每次 都通过人工处理这些重复故障大大浪费了运维人员的时间,且降低了处理效率,为此我们 提出一种基于AI技术的智慧运维知识分析方法用于解决上述问题。
技术实现要素:
本发明的目的在于提供一种基于AI技术的智慧运维知识分析方法,以解决上述背 景技术中提出的问题。 为实现上述目的,本发明提供如下技术方案:一种基于AI技术的智慧运维知识分 析方法,包括如下步骤: S1、通过检测系统实时检测设备运行状态和负载数据,当设备运行发生故障或负 载过大时,将故障信号收集并传输至AI分析引擎; S2、通过AI分析引擎对故障信号进行解析分析,并根据解析结果与知识库内的运 维数据相匹配; S3、AI分析引擎生成故障处理方案,并将处理方案反向回馈至知识库,丰富知识库 数据; S4、执行单元根据故障处理方案执行运维流程; S5、执行运维流程后生成运维报告。 优选的一种实施案例,步骤S1中,所述监测系统通过传感器等采集设备不间断收 集设备实时的负载数据,并根据设备负载阈值判断设备是否超负载运行。 优选的一种实施案例,步骤S2和步骤S3中,所述知识库包括故障数据库、方案数据 库、收集模块和判断模块,所述故障数据库内的故障数据与方案数据库内的方案数据相互 对应,所述收集模块用于对运维人员过往处理的故障信息和方案进行收集,所述判断模块 判断识别故障数据与方案实施是否一致。 优选的一种实施案例,步骤S2和步骤S3中,所述AI分析引擎连接人工介入系统,所 述人工介入系统包括显示器和输入单元,用于对AI分析引擎生成的处理方案进行合理性进 行检测,并可通过输入单元主动输入处理指令或对多个处理方案进行择优选择。 优选的一种实施案例,步骤S2中,所述AI分析引擎包括解析单元模型,用于对故障 数据进行解析并根据知识库内存储数据选取处理方案,所述解析单元模型生成方法如下: 3 CN 111597204 A 说 明 书 2/3 页 构建AI学习框架,以历史人工运维数据作为AI学习框架的训练集对所述机器学习框架进行 训练,得到解析单元模型,并以解析后的方案文本和与解析前的输入文本对应的答案作为 AI学习框架的训练集对AI学习框架进行训练,提高解析单元模型。 优选的一种实施案例,所述解析单元模型解析得到答案之后,根据统计概率和反 馈机制校正答案,当所述解析后的文本输入得出多个答案时,获取答案被选择的次数,确定 所述被选择的次数最多的答案为标准答案,存于解析单元模型和知识库中。 优选的一种实施案例,所述AI分析引擎还包括存储单元和更新训练单元,所述存 储单元用于存储故障数据对应的解析后的输入文本和答案,所述更新训练单元用于利用解 析后的输入文本和答案对解析单元模型进行训练。 与现有技术相比,本发明的有益效果是:通过建立AI分析引擎和知识库,通过解析 单元模型对过往运维人员的运维数据进行收集,并通过知识库将故障数据和处理方案进行 相互对应,从而在发生重复故障时,通过AI分析引擎分析故障信息,从而根据分析结果从数 据库内选取对应处理方案,从而极大的节省了运维人员的工作量,且发生重复故障时的处 理效率得到提高。 附图说明 图1为本发明流程框图; 图2为本发明中知识库结构框图。