带MAX5的X3850 X5叠加后log灯常亮的解决办法
2台X3850 X5的服务器,每台x3850 x5都连接有MAX5内存扩展模块,叠加的物理连线图如下所示
图1-1 带MAX5的x3850叠加图
2台服务器开机以后,log日志灯都亮。在IMM里可以看见以下事件。
图1-2 IMM里FPGA报错
提示X3850 X5和MAX5的FPGA微码不匹配。这时候需要对服务器进行微码升级
进入uEFI->system log events,清除所有的日志文件,然后断电5分钟,再开机。
微码升级前,需要把MAX5之间的连接线拔除。MAX5与x3850之间的连接线一定要接上,并都保持通电状态。
1. 微码下载链接:
1)FPGA微码:ibm_fw_fpga_g0ud81b-2.02_
2)IMM微码:ibm_fw_imm_yuood4g-1.32_
3)UEFI微码:ibm_fw_uefi_g0e173b-1.73_
下载链接:
www.ibm/support/fixcentral/systemx/quickorder?parent=ibm~Systemx3850X5&product=ibm/sys
temx/7143&&platform=All&function=fixId&fixids=ibm_fw_fpga_g0ud81b-2.02_windows_32-64,ibm_fw_imm_yuood4g-1.32_windows_32-64,ibm_fw_uefi_g0e173b-1.73_windows_32-64&includeRequisites=1&includeSupersedes=0&downloadMethod=http&source=fc
2. 登陆管理口和升级微码的方法如下:
请用一台笔记本电脑,一条网线直接连接到服务器的管理口(system management)通过地址:192.168.70.125访问,用户名是:USERID(大写),密码是:PASSW0RD(中间那个0是数字0),连接上之后进入IMM配置界面. 然后选择Tasks——firmware update,点击browse选择本地已经下载好的更新文件,然后点击update,更新完成后重启服务器即可.
升级微码注意事项:
1)对您硬盘里的重要数据进行备份。
2)在升级微码期间不能断电,最好能接UPS等设备。
3)请先升级IMM微码之后,间隔15分钟,重新启动之后再升级UEFI微码,最后升级FPGA。请下载相应的readme文件,并阅读相关注意事项。
4)升级之后请将服务器正常关闭,拔出电源线,3-5分钟后正常开机测试。
连接到IMM,在"Monitors-->Virtual Product Data"查看升级前的各微码版本
图uefi boot2-1 升级前各微码版本号
(1)升级IMM ,如果服务器有进入操作系统,先关机,等服务器电源指示灯在闪烁时才升级。
图2-2 上传IMM微码
图2-3 升级IMM微码过程
升级完IMM后,在"Virtual Product Data"里的IMM版本号不会立即更新,此时需要重启IMM。
(2)IMM重启后,升级UEFI,升级前需要开机,让服务器停留在UEFI界面(F1进入SETUP或者F12进入BOOT选项都可以)。如果不开机,升级时会有如下错误提示:
图2-4 关机状态下升级UEFI的报错信息
升级完UEFI后,在"Virtual Product Data"里也不会里面看见更新,重启IMM,并进入UEFI,才能看见更新后的UEFI微码版本。
(3)IMM重启后,升级FPGA,升级成功后也重启IMM。
升级以上3个微码后,可以在"Virtual Product Data"看见更新后的微码版本号。
图2-5 升级后的各微码版本号
这时候log灯不再报警,一切正常。
3. UEFI中"Disable Slot1-7 Legacy Options ROM"
经过一个晚上,Node1的log灯再次亮,此时连接IMM,查看到"No Op ROM Space"的报警,如下所示。
图3-1 IMM中报警信息
开机按F1进入UEFI菜单,选择"System Settings-->Device and I/O Ports-->Enable/Disable legacy ROM execution",将主板集成网卡和slot1-7设备的ROM设置为Disabled.
图3-2 UEFI设置Legacy Option ROM
4. 参考资料:
以下资料来源于IBM工程师:
故障现象(其一或多个现象):
1.服务器System Error 灯亮
2.有时LPD 板上 Log 灯亮
3.IMM Log记录的报错信息如下
FW/BIOS, firmware progress (Firmware Error) hang
Error: Error: FW/BIOS, connector (No Op ROM Space) PCI express Slot X fault
4.有时会造成服务器Auto reboot
参考解决方案:
TIPS:H197144
PCI OPTION ROM SPACE ERRORS IN UEFI SERVERS
www-947.ibm/support/entry/portal/docdisplay?lndocid=MIGR-5084743
详细的解决步骤如下:
1、调整PCI设备的物理位置
2、升级微码(IMM/UEFI/FPGA)
3、恢复UEFI的出厂设置
4、Disable NIC(Onboard) PXE ROM
5、Enable/Disable Onboard Devices
6、Disable Slot1-7 Legacy Options ROM
7、更改ROM执行顺序
8、uEFI 模式下Disable Intel NIC ROM
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论