计算机系统容错技术分析
计算机系统容错技术分析
随着计算机技术的飞速发展和网络技术的广泛应用,计算机为生产生活提供了大量的便利。只有计算机系统拥有良好的容错性能,才能保证计算机系统处于正常运行状态,为保证计算计算机系统运行的稳定,计算机系统容错技术需要受到重视。据此,本文对计算机系统容错技术进行简要分析。
标签:计算机;系统容错技术;错误
1.计算机系统常见错误
计算机系统错误既有软件层面上的软件运行故障,又有硬件层面上的某个组成计算系统的硬件失灵。近年来电路主板工艺技术的提高,使得出现硬件层面上主要的错误集中于计算机处理器的瞬间故障。出现计算机处理器故障的主因可能是计算机晶体管无法正常工作,因为电压值超过计算机处理器能够承载极限,导致计算处理器瞬间故障。计算处理器出现故障的原因还可能是计算处理器的主频设置过高,目前众多部门应用计算机系统为节省更新换代,对计算处理器进行超频处理,增加计算处理器的负荷,导致故障出现。计算处理器出现故障的原因还可能是
因为,近年来计算机制造技术的发展,处理器中晶体管数量庞大,当一个晶体管出现故障时,就导致计算处理器出现运行错误的情况。针对计算机系统出现的诸多故障问题,设计可靠的计算机容错系统,显得十分必要,通过使用计算机硬件容错模块能够极大降低计算机故障几率,为生产工作提供安全与保障。
2.计算机硬件错误的容错技术分析
2.1信息冗余
信息冗余是指通过在原始数据上添加冗余信息,进一步实现计算机故障检测或者故障恢复等目的的容错方法,主要包括检错编码以及纠错编码两种。检错编码能自主的发现系统故障,而纠错编码在主动发现错误的基础上,还具有纠正错误的能力,对计算机系统的可靠性起到保障作用。信息冗余这种容错方法通常是通过将冗余信息编写在初始数据中,主要应用在信息的传输以及处理中,其中具有代表性的编码技术包括奇偶校验码、循环冗余校验码等,通过这些编码技术的不断发展,能促使信息冗余技术在计算机系统的运行过程中充分发挥作用。
2.2硬件冗余
硬件冗余技术可以按照冗余程度的不同分为部分冗余以及完全系统冗余。其中完全系统冗余包括冷备、温备、热备和双工等,如系统完全冗余对应的工作方式主要有雙系统冷备、双系统双工等。双系统双工的工作方式主要是针对要求计算机系统运行安全性较高的系统,如果对系统的要求不高,可以合理的应用双系统冷备、双系统热备等技术。现阶段,研究学家针对计算机冗余方法的研究较多,并且该技术在计算机安全运行方面已经取得良好应用。
2.3时间冗余
时间冗余技术通常应用在对计算机系统的可靠性以及实时性不高的系统中,能实现容错机制。在时间冗余技术应用在实践中时,可以实现同种类型硬件的基础上的相同数据在不同的时间段内执行一定的指令,并利用系统中的相关电路以及数据延迟单元,根据两者有效结合处理后的结果拷贝出与延迟数据相对应的版本,再将不同版本输送到表决器进行判断。时间冗余技术的重点在于延迟时间的判断,即延迟时间出现误差将导致表决器的输出结果出现错误不利于实现系统容错。
3.容错的实现步骤
3.1对系统故障问题进行自动检测
计算机系统出现故障后,会导致错误,由此可能会引起失效。而部分失效会造成系统的逻辑故障。在对逻辑故障进行检测时,可以使用的方法较多,其中较具典型性和代表性的有奇偶校验、一致性校验等。
3.2故障限制与屏蔽
计算机系统中的故障都会出现在某个部位,但由于系统本身是一个整体,所以局部故障可能会影响到其它的功能,为使故障的影响范围降至最低程度,需要对故障进行限制,这是容错技术在计算机系统中应用时较为重要的一个作用。通过故障限制,将故障的传播限定在一个特定的区域内,避免对其它的区域造成影响。
3.3重试与诊断
计算机系统是一个较为复杂的系统,在对系统进行首次操作时,可能无法成功,但再次操作却可以成功。这种情况大多是因为瞬时故障引起,其通常不会造成物理破坏,所以只需要通过重试便可进行解决。容错技术中的诊断,则是在故障检测并未提供故障性质、发生位置等信息的情况下,对故障进行准确判断的做法。
3.4重组与恢复
当容错系统检测到计算机当中存在故障问题时,并判断该故障为水久性故障后,通过重组,可对失效的器件进行替代,并将其从系统中隔离出去。这一过程也可通过冗余系统来完成,由此可以使计算机系统的性能得到保障。
系统错误
3.5重启
当计算机系统中出现的错误导致大量的信息被破坏,并且系统未设计恢复功能,这样系统无法通过自动恢复来消除错误的影响。如果系统在出现错误时,并未遭到破坏,可以通过重新启动来恢复相关的操作。
3.6修复与重构
通过诊断到计算机系统中某个故障元件后,可用完好的元件进行替换,从而快速消除故障,使系统恢复正常运行。容错技术中的修复,既可以在脱机的状态下进行,也可在联机的情况下完成。当元件替换后,应当使修复的模块重新加入到系统当中,这个过程即为重构。
4.结语
计算机系统已经普遍应用在人们的日常生活以及办公中,因此应该加强容错技术在计算机系统安全运行中应用的研究,进而保证计算机系统的可靠性。
参考文献:
[1]黄蕾.计算机系统容错技术的思考[J].计算机产品与流通,2017(10):8.
[2]谢建洲.计算机系统容错技术研究[J].电脑知识与技术,2016,12(06):250-252.
[3]田丽娜,王海龙.计算机系统容错技术分析[J].科技展望,2016,26(13):14.

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。