
技术摘要:
本发明公开了一种服务器可靠性测试方法和装置,该方法包括:响应于服务器已经满配处理器而使服务器上电,并生成验证系统配置和检查错误状态寄存器的测试函数脚本;对系统多次执行软重启,在每次后均执行一次测试函数脚本并记录测试结果;对系统多次执行关机并使用电源 全部
背景技术:
服务器处理器,顾名思义就是在服务器上使用的CPU。众所周知服务器是网络中的 重要设备,要接受少至几十人、多至成千上万人的访问,因此对服务器具有大数据量的快速 吞吐、超强的稳定性、长时间运行等严格要求。所以说CPU是计算机的大脑,是衡量服务器性 能的首要指标,服务器处理器的可靠性对于服务器具有至关重要的作用。但现有技术中的 检查方法只是简单地确认是否报错,不能确保服务器多次启动后服务器处理器的可靠性。 针对现有技术中服务器测试不足以检查可靠性的问题,目前尚无有效的解决方 案。
技术实现要素:
有鉴于此,本发明实施例的目的在于提出一种服务器可靠性测试方法和装置,能 够全方位地对服务器进行反复检查,确保服务器在更高水平上的可靠性。 基于上述目的,本发明实施例的第一方面提供了一种服务器可靠性测试方法,包 括执行以下步骤: 响应于服务器已经满配处理器而使服务器上电,并生成验证系统配置和检查错误 状态寄存器的测试函数脚本; 对系统多次执行软重启,在每次重启后均执行一次测试函数脚本并记录测试结 果; 对系统多次执行关机并使用电源按钮重新上电,在每次上电后均执行一次测试函 数脚本并记录测试结果; 对系统多次执行使用重置按钮的硬复位,在每次硬复位后均执行一次测试函数脚 本并记录测试结果; 对系统执行针对处理器的压力测试并进行多次迭代,执行测试函数脚本并记录测 试结果; 响应于上述测试结果中均不存在错误而判定服务器通过可靠性测试。 在一些实施方式中,服务器已经满配处理器包括:服务器在每个通道的所有处理 器插槽和双列直插存储模块上均安装由处理器;使服务器上电包括:将服务器引导到可扩 展固件接口或操作系统;测试函数脚本为包括验证系统配置和检查错误状态寄存器的XDP CScripts,其中验证系统配置包括检查超通道互联、内存储器和外围设备互联扩展的连接 速度和状态;检查错误状态寄存器包括检查处理器和芯片组的错误状态寄存器。 在一些实施方式中,执行测试函数脚本并记录测试结果包括: 生成XDP形式的测试日志,测试日志记载有验证系统配置和检查错误状态寄存器 4 CN 111597064 A 说 明 书 2/6 页 中每个错误的合法性和严重性。 在一些实施方式中,对系统执行针对处理器的压力测试并进行多次迭代,执行所 述测试函数脚本并记录测试结果包括: 在每次迭代后均执行一次测试函数脚本并记录测试结果、或在多次迭代完成后执 行一次测试函数脚本并记录测试结果。 在一些实施方式中,方法还包括:对系统执行针对处理器的压力测试并进行多次 迭代时,还保留每次迭代的压力日志作为测试结果的一部分。 本发明实施例的第二方面提供了一种服务器可靠性测试装置,包括: 处理器;和 存储器,存储有处理器可运行的程序代码,程序代码在被运行时执行以下步骤: 响应于服务器已经满配处理器而使服务器上电,并生成验证系统配置和检查错误 状态寄存器的测试函数脚本; 对系统多次执行软重启,在每次重启后均执行一次测试函数脚本并记录测试结 果; 对系统多次执行关机并使用电源按钮重新上电,在每次上电后均执行一次测试函 数脚本并记录测试结果; 对系统多次执行使用重置按钮的硬复位,在每次硬复位后均执行一次测试函数脚 本并记录测试结果; 对系统执行针对处理器的压力测试并进行多次迭代,执行测试函数脚本并记录测 试结果; 响应于上述测试结果中均不存在错误而判定服务器通过可靠性测试。 在一些实施方式中,服务器已经满配处理器包括:服务器在每个通道的所有处理 器插槽和双列直插存储模块上均安装由处理器;使服务器上电包括:将服务器引导到可扩 展固件接口或操作系统;测试函数脚本为包括验证系统配置和检查错误状态寄存器的XDP CScripts,其中验证系统配置包括检查超通道互联、内存储器和外围设备互联扩展的连接 速度和状态;检查错误状态寄存器包括检查处理器和芯片组的错误状态寄存器。 在一些实施方式中,执行测试函数脚本并记录测试结果包括: 生成XDP形式的测试日志,测试日志记载有验证系统配置和检查错误状态寄存器 中每个错误的合法性和严重性。 在一些实施方式中,对系统执行针对处理器的压力测试并进行多次迭代,执行所 述测试函数脚本并记录测试结果包括: 在每次迭代后均执行一次测试函数脚本并记录测试结果、或在多次迭代完成后执 行一次测试函数脚本并记录测试结果。 在一些实施方式中,步骤还包括:对系统执行针对处理器的压力测试并进行多次 迭代时,还保留每次迭代的压力日志作为测试结果的一部分。 本发明具有以下有益技术效果:本发明实施例提供的服务器可靠性测试方法和装 置,通过响应于服务器已经满配处理器而使服务器上电,并生成验证系统配置和检查错误 状态寄存器的测试函数脚本;对系统多次执行软重启,在每次重启后均执行一次测试函数 脚本并记录测试结果;对系统多次执行关机并使用电源按钮重新上电,在每次上电后均执 5 CN 111597064 A 说 明 书 3/6 页 行一次测试函数脚本并记录测试结果;对系统多次执行使用重置按钮的硬复位,在每次硬 复位后均执行一次测试函数脚本并记录测试结果;对系统执行针对处理器的压力测试并进 行多次迭代,执行测试函数脚本并记录测试结果;响应于上述测试结果中均不存在错误而 判定服务器通过可靠性测试的技术方案,能够全方位地对服务器进行反复检查,确保服务 器在更高水平上的可靠性。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。 图1为本发明提供的服务器可靠性测试方法的流程示意图。