服务器运维常见的故障及其解决办法
服务器运维常见的故障及其解决办法
进⼊信息时代,各种⾏业对数据的安全和技术要求也越来越⾼,,同时也遇到了各种各样的服务器故障问题,虽然能够接到服务器⼚商的⽀持,但是往往耗时耗⼯,特别是有些不能够⽴即判断和解决的问题,造成了企业不必要的损失,下⾯是针对⼀些常见的服务器故障现象和解决⽅法,以便更好的更快的进⾏故障处理和排查。
01
服务器常见故障及现象
有关服务器⽆法启动的主要原因 :
①市电或电源线故障(断电或接触不良)
②电源或电源模组故障
③内存故障(⼀般伴有报警声)
④CPU故障(⼀般也会有报警声)
⑤主板故障
⑥其它插卡造成中断冲突
02
服务器⽆法启动
①检查电源线和各种I/O接线是否连接正常。
②检查连接电源线后主板是否加电。
③将服务器设为最⼩配置(只接单颗cpu,最少的内存,只连接显⽰器和键盘)直接短接主板开关跳线,看看是否能够启动。农村创业致富项目
④检查电源,将所有的电源接⼝拔下,将电源的主板供电⼝的绿线和⿊线短接,看看电源是否启动。
⑤如果判断电源正常,则需要⽤替换法来排除故障,替换法是在最⼩化配置下先由最容易替换的配件开始替换(内存、cpu、主板)
03
系统频繁重启
造成系统频繁重启的原因:
①电源故障(替换法判断解决)
②内存故障(可从BIOS错误报告中查出)
③⽹络端⼝数据流量过⼤(⼯作压⼒过⼤)
④软件故障(更新或重装操作系统解决)
04
服务器死机故障判断处理
服务器死机故障⽐较难以判断,⼀般分为软件和硬件两个⽅⾯。
1、第⼀⽅⾯-软件故障
①⾸先检查操作系统的系统⽇志,可以通过系统⽇志来判断部分造成死机的原因。
②电脑病毒的原因。
③系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件⽆故障后做出,⽽且需要软件提供商提供帮助。
④软件使⽤不当或系统⼯作压⼒过⼤,可以请客户适当降低服务器的⼯作压⼒来看看是否能够解决
如何把笔记本变成无线路由器
2、第⼆⽅⾯-硬件故障
①硬件冲突
跳舞草②电源故障或电源供电不⾜,可以通过对⽐计算服务器电源所有的负载功率的值来作出判断。
③硬盘故障(通过扫描硬盘表⾯来检查是否有坏道)
④内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断)
⑤主板故障(使⽤替换法来判断)
⑥CPU故障(使⽤替换法)
⑦板卡故障(⼀般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可⽤替换法判断处理)
注意:系统死机故障需要在处理完后需要在⼀段时间内进⾏⼀定压⼒的拷机测试来尽⼀步检查故障是否彻底解决。
怎么修改ip地址05
安装操作系统时提⽰不到硬盘
故障原因:
①⽆物理硬盘设备
②硬盘线缆连接问题
③没有安装硬盘控制器驱动或驱动不相符
家长打骂孩子违法吗
06
等离子和led哪个好如何获得驱动程序
使⽤随机光盘制作相应驱动
07
⽤正确的驱动仍然⽆法加载硬盘控制器驱动
查看是否启⽤了hostraid功能
08
新购硬盘,安装到机器后,机器⾃检⽆法通过
①将新的硬盘取下,机器是否可以⾃检通过;
②检查新增加的硬盘的ID号是否与原来的硬盘的ID号相同,如果硬盘的ID号相同的话,⾃检将⽆法通过。
09
如何格式化SCSI硬盘
1、有操作系统的情况:使⽤磁盘管理⼯具格式化;
2、⽆操作系统的情况:在SCSI管理控制界⾯格式化;
3、以ADAPTEC Raid卡为例:开机-出现CTRL+A 信息时,按CTRL+A进 ⼊
①选中通道A
②选中SCSI UTILITY-将检测到硬盘-选中要检测的硬盘
③选中FORMAT可对硬盘进⾏全⾯格式化
④选中VERIFY可对硬盘进⾏检测,检查是否有坏道
注意:在格式化硬盘时不能中断或停电,不然会损坏磁盘
10
在Aisino 系列中有RAID卡机器,当其中⼀个硬盘不能正常⼯作RAID报警,但系统能正常运⾏,怎么办
1、⽤⼀个新硬盘,确保容量⼤于或等于不能正常⼯作的硬盘,最好⽤相同型号的硬盘替换即可。
2、RAID卡相关常见故障
第⼀类: RAID卡本⾝有问题
①经常表现为RAID信息丢失,硬盘经常掉线,不能做REBUILD,开机⾃检时检测不到硬盘或时间长。
典型故障A:作完RAID1,安装操作系统,⼀切正常,但第⼆次重启系统时,发出报警声,经检查发现⼀块硬盘掉线,REBUILD后,⼜恢复正常,但重启后⼜掉线。怀疑为硬盘故障,校验硬盘后均⽆问题。最后更换RAID卡,故障解决。
典型故障B:机器经常死机,且有时候启动速度⾮常慢。观察系统⽇志,发现在系统启动时有这样⼀个错误提⽰:设
备/devices/scsi/port0 在传输等待的时间内没有响应。更换RAID卡后,恢复正常。
第⼆类: 硬盘本⾝问题
①表现为硬盘掉线,在RAID阵列中的状态为DEAD,或者在作REBUILD时,作到某⼀进度就不能继续
典型故障:硬盘掉线后,做REBUILD时,作到20%时出现错误提⽰⽆法继续进⾏。在确认掉线硬盘,硬盘盒及SCSI电缆都能正常⼯作后,对在线硬盘进⾏校验,发现有坏道,修复硬盘,重做REBUILD,恢复正常。
第三类: 硬盘盒或模组的接触问题
①此类问题经常表现为RAID卡根本检测不到硬盘,此类问题⽐较简单,但在处理硬盘盒相关机器时,需要注意⼀些问题。
典型故障:RIAD卡中检测不到硬盘,把SCSI电缆接到主板的ULTRA160接⼝上,故障依旧,拔出硬盘盒(不包括硬盘盒后⾯的托架)更换,故障依旧,更换硬盘,还是不⾏。最后卸下硬盘盒后⾯的托架(⾮热插拔部分),发现后托架上80PIN接⼝上的⼀根针弯曲,校直弯针,恢复正常。
11
在服务器上使⽤的SCSI硬盘,为什么硬盘的ID号不能设置为7
SCSI控制器中,默认将ID=7设置为硬盘控制器占,所以硬盘的ID号不能设置为7
12
为什么开机⾃检⽆法通过
解决⽅法:
①机器切断电源,将机箱打开,⽤“COMS CLEAR”跳线的跳线帽将“COMS CLEAR”跳线的另外两个针短接(跳线参看主板说明书)
②机器加电,⾃检,等机器⾃检完闭,报CMOS已被清除,然后将机器电源关掉,把跳线复原即可
③机器重新开机

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。