
技术摘要:
本公开涉及一种计算机设备运维管理系统,包括:客户端,所述客户端至少包括一配置监听模块和一任务执行模块;服务端,所述服务端至少包括一WEB管理界面、一配置管理模块及任务调度模块;分布式存储,其配置为存储可注册系统服务,将所述新配置文件传送至所述客户端并置 全部
背景技术:
移动互联网时代与大数据时代的来临,正在不断颠覆各行各业。运维人员同样面 临各种挑战与机会。一款软件产品的发布离不开两类人的支持,即开发和运维。人们常常会 把他们提到一起,如今DevOps开发模式的盛行也正是对他们的重新定义。目前软件环境的 变化可以说是开发者的黄金时代,而对于运维来说,这些变化正给他们带来新的挑战和期 望。过去的十年给软件开发环境带来了翻天覆地的变化,其中最大的变化是通过开源和云 来生产基础设施。就产品的灵活性和生产力而言,这绝对是对开发者利好的消息,但也给运 维人员带来了一些新的挑战和期望。在过去,开发者的工具箱里仅有几个大型软件供应商 提供的单片式解决方案,比如Oracle、IBM、HP等。这些解决方案一般都比较昂贵,并且还会 伴随整合和更新较慢等特点。一旦公司购买了它们,无论它们是否适合你,你都必须好好地 利用它们。如今,丰富的开源和云解决方案的出现彻底把开发者从传统的工具依赖中解放 出来,开发者可以在过去同等的条件下享受更好的基础设施。开发者也可以根据自己的工 作需求选择合适的工具,并且它们是免费廉价的,这些工具能够更好更快的进行整合,根据 需求进行规模化扩展。现在,一个公司使用多种数据库(Redis用于缓存、Elasticsearch用 来搜索、MySQL等等)已经变的非常普遍,这些工具分工明确,兼容多个平台。与此类似的各 种分工工具还有:监控工具、计算环境、应用框架等。开发者可以因时制宜地选择各种工具, 提高产品的开发灵活性、生产力、性能等。但是大量的产品问题都是来自内部的代码部署和 架构变更。当进行持续部署(更不用提虚拟化和基础设施即代码了),变更的速度会大幅提 升,速度地提升也很容易导致产品出错。由此可以得出一个论点,即持续部署可以减少潜在 的、灾难性的错误,因为变化的周期变短、增量变少。现代基础设施之间的最佳组合给运维 人员带来了不少灾难。可移动的部分越来越多、依赖关系更加复杂以及更多的监控工具会 时不时地发出各种警报。在这样的环境中,故障排除已经成为一个永无止境地分类过程:过 滤报警内容、优先考虑和应对潜在的事故,可以简称为报警疲劳。这已经是一个很常见的现 象了,运维人员抱怨到:他们有50%—70%的时间都消耗在了响应报警上,以至于影响到了 他们的核心工作:构建业务支持的基础设施架构。运维人员迫切需要一个高效的平台来处 理这些告警和任务调度。一个很好的出发点就是利用定时任务系统来实现任务调度,例如 在中国专利申请公开CN105872073A中公开了一种基于ETCD集群的分布式定时任务系统的 设计方法,在该方法中,包括以下步骤:S1、根据业务需求准备定时任务的配置文件;S2、定 时任务配置服务将所述配置文件存入ETCD集群中的第一服务器,再由所述ETCD集群将所述 配置文件的存储路径传送至执行服务集群中的第二服务器;S3、所述第二服务器按照所述 存储路径从第一服务器中读取配置文件,并应用所述配置文件;S4、需要更新配置文件时, 直接用新的配置文件替换ETCD集群中的配置文件;S5、所述第二服务器监听配置文件的更 新;S6、所述第二服务器申请执行定时任务;S7、当所述第二服务器申请到定时任务时,开始 3 CN 111586043 A 说 明 书 2/6 页 执行所述定时任务,并更新定时任务的申请状态至ETCD集群中,增加当前定时任务的描述 信息至新的配置文件中;否则,重复步骤S5。可以看到,在该申请中,服务集群中的第二服务 器通过共享同一个配置文件,采用竞争方式来完成一个定时任务,对于不同的定时任务,可 以根据业务需求随时更新配置文件,并且直接用新的配置文件替换ETCD集群中的配置文 件。但整个环节不具备告警环节,因此在系统出现错误时,运维人员对错误的排查是非常困 难的。
技术实现要素:
鉴于现有技术存在的上述问题,本发明的目的是提供一种使得运维人员能够随时 对任务调度的配置文件进行调整及掌握警报信息的计算机设备运维管理系统。 为了实现上述目的,本发明一个方面提供的一种计算机设备运维管理系统,包括: 客户端,所述客户端至少包括一配置监听模块和一任务执行模块,所述配置监听 模块配置为获取当下配置文件,所述任务执行模块配置为根据所述配置文件将计划任务注 册为系统服务并根据所述系统服务执行所述计划任务; 服务端,所述服务端至少包括一WEB管理界面、一配置管理模块及任务调度模块, 所述WEB管理界面配置为向一管理终端提供基于C/S架构的WEB服务,并接收配置更改指令 或任务调度指令,所述配置管理模块配置为根据所述配置更改指令生成新配置文件,所述 任务调度模块配置为根据所述任务调度指令向所述客户端发出调度指令; 分布式存储,其配置为存储可注册系统服务,将所述新配置文件传送至所述客户 端并置为当下配置文件; 数据库,所述数据库配置为存储所述WEB管理界面对应文件及所述计划任务对应 的任务列表。 作为优选,所述分布式存储还存储有多个所述客户端对应的IP地址,所述任务调 度模块包括: RPC连接池,其配置为根据多个所述客户端的IP地址,保存多个所述客户端与所述 服务端的已建立的通信连接; 定时模块,其配置为从所述数据库获取所述任务列表并生成定时信息; 调度模块,其配置为根据所述定时信息及已建立的通信连接对应向所述客户端发 送调度指令。 作为优选,所述任务调度模块还包括告警模块,所述告警模块配置为根据所述定 时模块及所述调度模块的错误日志生成报警信息,所述WEB管理界面还配置为向所述管理 终端推送所述报警信息。 作为优选,所述分布式存储为基于键-值的存储系统。 作为优选,所述分布式存储包括: HTTP服务模块,其配置为接收数据存储或变更请求并传送配置文件、客户端IP地 址及客户端的负载信息,且以客户端IP地址为键,以配置文件及负载信息为值; 存储模块,其配置为根据所述HTTP服务模块存储所述配置文件、客户端IP地址及 客户端的负载信息。 作为优选,所述分布式存储还包括一致性校验模块,其配置为对所述配置文件、客 4 CN 111586043 A 说 明 书 3/6 页 户端IP地址及客户端的负载信息进行一致性校验。 作为优选,所述分布式存储还包括数据预写模块,其配置为在所述一致性校验模 块的校验通过之前进行数据预写。 作为优选,所述数据预写模块包括对数据预写操作进行记录的日志模块以及对在 数据校验通过后进行数据存储快照的快照模块。 作为优选,所述任务执行模块在将计划任务注册为系统服务时,向所述分布式存 储发送所述客户端的负载信息,所述调度模块还配置为获取所述客户端的所述负载信息, 并根据所述负载信息及已建立的通信连接选择负载较低的所述客户端执行所述计划任务。 本发明提供的一种计算机设备运维管理系统,可使运维人员通过笔记本、PC或智 能移动终端,通过WEB管理界面对客户端的计划任务对应的配置文件进行创建、更新,同时 还可由管理终端接收告警模块的各种告警信息,便于运维操作。 附图说明 图1为本发明的一种计算机设备运维管理系统的结构框图。 图2为本发明的一种计算机设备运维管理系统中的分布式存储的结构框图。 主要附图标记: 10-服务端,20-客户端,30-分布式存储,40-数据库,50-管理终端,11-WEB管理界 面,12-配置管理模块,13-任务调度模块,131-告警模块,132-RPC连接池,133-定时模块, 134-调度模块,21-配置监听模块,22-任务执行模块。