首页 运维干货硬件运维:记录一次被服务器电源模块坑成狗的案例

硬件运维:记录一次被服务器电源模块坑成狗的案例

运维派隶属马哥教育旗下专业运维社区,是国内成立最早的IT运维技术社区,欢迎关注公众号:yunweipai
领取学习更多免费Linux云计算、Python、Docker、K8s教程关注公众号:马哥linux运维

事由

今天开始,逐步把硬件运维过程中遇到的坑整理成公众号文章,以便踩到坑的人共勉,也给还没踩到坑的人一个提醒。至于这款电源模块,反正我已经被这款电源模块(这里说的艾默生电源PH-79RDR指的是DELL PC服务器使用的电源模块)坑过N回了,总体总结成3类问题

问题1 :PH-79RDR在低版本的BIOS中无法选择引导项

由于机房现场特殊的电源环境限制,该机房只能使用高压直流电源模块,于是将一台DELL R720服务器的电源模块更换为PH-79RDR,瞬间点亮,很是开心。

然而,问题来了

我们装系统都是选择PXE安装,可这坑爹的,居然在引导(BIOS Boot Manager)的时候只有Normal选项,没其他选项。这里忘记截图,我贴上一个正常情况下的截图。

硬件运维:记录一次被服务器电源模块坑成狗的案例插图

反复确认了几遍之后,放弃挣扎,拨打了dell售后根据工程师要求,将BIOS升级到2.4.3版本。照方法升级后,重启进BIOS Boot Manager很赞!问题解决了!!!

问题2 :PH-79RDR在2.4.3版本的BIOS中电源管理初始化失败

还开心着问题解决了的时候,我发现了新的问题。在某次重启过程中发现告警电源管理固件初始化失败。

WarningPower management fireware not responsive

Disconnect and reconnect system input power

WarningPower management fireware initialization error

不仅如此,最坑爹的来了,在系统命令行执行init 6命令后,只见关键,不见自动开机,必须点击开机键才能开机!

开机后继续卡在Strike the F1 key to continueF2 to run the system setup program,无法进系统。

在DELL工程师的继续指导下,尝试了升级电源管理固件,各种不耐烦情况下,我还是尝试了4种不同的方法进行更新固件(windows下更新除外),全部以失败告终

硬件运维:记录一次被服务器电源模块坑成狗的案例插图1

问题3 :PH-79RDR电源官方不支持高压直流!

看来准备要更换电源模块才能解决问题了,按照工程师要求吧电源模块的备件号给他PH-79RDR,结果被告知,这款电源模块支持在交流环境下使用,什么,这款电源模块可是从你DELL买的,说不支持就不支持了,而且在高压直流环境下,已经有好几台服务器使用这款电源模块在线上跑着呢。经过各方查找,最后证实PH-79RDR这款确实是非官方认证的资产高压直流,实际上是支持的!(期间为了能够正常派件保修,我将服务器换到交流环境下跑了一下,依然出现电源管理固件初始化失败的提示)

由于被官方告知,这款电源不支持高压直流,所以在DELL上门工程师陪同下,一起在交流环境做了一次测试,结果显示问题依旧。终于DELL终于同意更换电源模块了。结果更换完问题居然还在。

问题终于解决了

经过和dell工程师讨论,决定将BIOS版本降级到2.4.2试试。经过降级BIOS,重启。哇咔咔,一切完美,所有问题解决。

结论与解决方案

1、艾默生电源PH-79RDR在BIOS 2.4.3版本下回出现电源管理初始化失败的问题,解决办法是将BIOS降级回2.4.2

2、艾默生电源PH-79RDR在1.*版本的BIOS下可能会出现引导选项缺失的问题

3、艾默生电源PH-79RDR在官方认证中,是不支持高压直流环境的,而实际使用过程中发现是可以支持的

4、补充一个艾默生电源PH-79RDR在另外一个案例中遇到的坑的结论,在电源管理固件本07.09.49下,该电源模块可能会出现异常自动重启的问题。解决办法是将电源固件版本升级到07.09.50

原文来自微信公众号:余果果园

本文链接:https://www.yunweipai.com/19549.html

网友评论comments

发表回复

您的电子邮箱地址不会被公开。

暂无评论

Copyright © 2012-2022 YUNWEIPAI.COM - 运维派 京ICP备16064699号-6
扫二维码
扫二维码
返回顶部