浅谈电力自助缴费系统的运行维护
甘肃省电机工程学会2014年度获奖优秀学术论文集
浅谈电力自助缴费系统的运行维护
蔡玺台树杰魏军
(1.国网甘肃省电力公司信息通信公司2.国网甘肃省电力公司电力科学研究院3.国网甘肃省电
力公司信息通信公司,甘肃兰州730050)
【摘要】随着国家电网公司信息化水平的不断提高,信息化建设已经成为电网企业发展水平的一个重要的衡量标准。自助缴费平台软件既能进一步增强公司与用电客户之间不问断交互响应、增强综合服务能力,又能进一步提高公司对各种服务设备及系统的管理水平,降低管理成本,对各种数据进行集中,提供各种不同的统计、汇总、分析功能,提供决策数据支撑。
【关键词】自助缴费;系统;运行;维护
Maintenance Of Power Ser f-se rvi ce Payment System
CaiXi Tai Shujie We iJun
(1.Power Corporation Information&Communication Com pan y2.Gansu El ectric Power Corporation Electric power re sea rch insfimte3.P owe r Corporation Information&Communication Company
La n zh ou730050)
1引言电力公司电费回收难,老百姓缴电费难已是一个社会不争的事实,它不光是电力公司内
部问
题,同时也是一个事关百姓名声的社会问题。许多地方政府都把解决此事做为政府为民办实事的内容之一。快节奏的生活方式,致使很大一部分人白天没时间缴纳电费,而电力公司目前缴费服务时间一般为白天。供电公司庞大的客户与电力公司有限的服务资源之间的矛盾日益突出。自助缴费系统就是一个良好的解决方案。借鉴其它相关行业经验,在电力系统内采用带有现金、银联缴费等方式的自助缴费机是一个很好的解决力‘法,其对缴费人的分流效果极其显著,可有效的解决电费回收、用户缴费难的问题。
电力自助缴费系统的运行稳定,才能满足广大电力用户正常购电需求,使电力自助缴费系统发挥实际的作用。因此电力自助缴费系统的运维工作,也显得尤其重要。
2电力自助缴费系统技术路线
通过调查研究与需求分析,用信息资源规划方法实现数据建模;用业务建模方法,实现业务流程分析与重组——业务建模和组织机构再造与建模——业务模型以及子系统设计及其功能建模;用三层系统技术架构设计,实现软件体系结构设计、开发模式支持;最后选择适当的开发环境(平台)实现软件编程,具体如下:
(1)本系统采用C/S、B/S架构设计,这使得系统易于扩展,便于维护和升级,且相对安全。
(2)在软件设计上采用自顶向下以及快速原型法的开发模型,在软件开发上采用面向对象的
220
2014·9甘肃·兰州
三层架构的设计方法,它分为为界面层、中间层、数据实体层。界面层处理界面表示逻辑,中间层处理业务逻辑,界面层访问中间层中的组件,执行相应的业务逻辑。
(3)数据库采用oracle数据库,这使得系统具有一定的开放性和良好的并行性和可伸缩性以及安全性。
(4)采用linux C技术实现系统的快速开发以便于企业的快速部署应用。 (5)基于MIS系统的
白助服务接口或银电联网接口等开发,它采用了目前最先进的面向服务
(SOA)的、松散耦合的分布式体系结构,客户端应用程序与服务的交互可以通过简单的“请求/应答”机制来完成,是安徽省电力公司建立的统一的安全、可靠、稳定、可伸缩、可扩展的管理信息系统基础平台,这可有效降低信息系统的投资风险,消除信息孤岛,缩短系统开发周期以及缩减开发成本。
3运行维护内容
运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备及其他信息系统的运行维护与安全防范服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
鉴于以上系统架构,运维人员在运维过程中,除日常的运维工作外,针对电力自助缴费系统,着重介绍如下两个方面入研究、实践,形成一套系统的更加适合行业和企业发展的精益管理方法。3.1  ORACLE数据库维护
a)OR ACL E数据库日常检查1、登录到主机上检查数据库是否服务停止,需要
运维人员经常经常进行检查。
2、数据库告警日志的检查
$ORACLE—HOME/admin/INSTANCE—NAME/bdump/alenjNSTANCE—NAME.109
此文件中记载数据库的启动、停止、系统级修改、告警信息、日志切换,是日常维护中的重要依据。
b)会话连接日志的清理会话连接日志$ORACLE—HOME/network/109/listener.109,此文件中
记载着每个连接登录时的I
P地址和时间等情况,可作为监测的依据,因为此文件不断增大,需要定期清空,清空方式为在$ORACLE—HOME/network/log目录下运行操作系统命
令。c)表空间
由于电力自助缴费系统,每天的交易量较大,数据库增长也较快,在数据库创建初期,表空间建立有限,虽然,在创建初期,也使用命令,使得数据库表空间随数据增长自动扩增表空问,但也不避免由于某些原因导致,表空间自动扩容不成功,因此,此时运维人员需要注意表空间的增长情况以及自动扩容情况。
d)数据库备份电力自助缴费系统中,保存的缴费记录数据,是比较重要的数据之一,因此需
要确保数据不能
丢失,及时做好备份,是最好的方法。建议每天进行增量备份,每周进行整体备份。
e)数据清理
为提升系统处理效率,对于较早的数据,建议先进行备份,备份完成后,将较早的数据删除,
以减少数据库的负担,提升查询,更新效率。
3.2业务系统a)
最大线程数量
由于电力自助缴费系统,为了并发处理多个业务,采用的是多线程的业务处理模式,系统的并
221
甘肃省电机工程学会2014年度获奖优秀学术论文集
发处理能力,受多方面的限制,例如服务器的性能,网络带宽等,在业务程序设计初期,业务的并发处理能力是已经设定的。因此,运维人员,需要注意在缴费高峰时段,密切注意日常的交易并发量,并注意CPU以及系统其他性能参数。以免造成交易失败,甚至服务器死机或者数据库死锁等情况。
b)僵尸进程在业务系统运行过程中,尤其是多线程业务系统,在系统运行过程中,可能会
由于并发量太
高导致内存不够用,亦或者程序本身BUG原因,可能会存在某一个进程假死,不进行任何处理,但却一直存在,所占用的部分内存空间等系统资源也不进行释放,我们成为僵尸进程。较多的僵尸进程,会严重影响系统的运行效率。运维人员最好能经常关注业务系统的进程列表,通过观察进程ID,查看是否存在僵尸进程,若存在,及时使用kill命令杀死此类进程。
c)账务处理在自助缴费系统运行过程中,可能或多或少会遇到账务不平的问题,此类问题不
可避免,产生
的原因有很多,网络不好,自助终端硬件故障,操作不规范等都可能会造成账务问题,遇到此类问题,就考验运维人员的处理以及分析能力了。其实在处理此类问题时,只要秉承一个原则,那就是所收金额与营销系统中的账务金额必须保持一致,那处理此类问题的思路就不会错了。因此一旦遇到此类问题,务必要与营销系统进行确认,确认营销系统中是否存在对应的交易,方能进行下一步的数据处理。
4运行维护的应急措施
4.1主站业务压力较大时常用措施在主站应用业务应用进入营业高峰期时,如果系统出现压力较大时出现突发事件时,根据现场
情况按以下措施进行处理:(1)停用所有主站应用业务应用外的各类
程序(外挂程序); (2)停用占用资源很高的业务:平台报表应
用,各类自动任务; (3)若情况没有改善则根据下面判断进行
处理。
电费网上缴费
4.2当主站应用业务转入手工处理业务时的规约 (1)到可用备份恢复并
开放查询功能,应对手工处理业务的需要; (2)人工记录的业务最
好有固定电子格式,便于汇总、核对;(3)主站平台主机硬件硬件
应急预案。
4.3突发事件现象
4.3.1危险陛分析,可能发生的突发事件类型(1)服务器配置资源不足,
导致业务系统运行不稳定; (2)操作系统配置参数不当,导致业务系统
运行不稳定; (3)服务器部分硬件设备故障造成服务器性能下降; (4)
服务器硬件损坏导致业务应用停止; (5)服务器操作系统故障导致业务
应用停止。4.3.2突发事件可能造成的危害程度将会造成该自助业务应
用系统硬件损坏,因运营环境恶化造成系统停机。4.3.3突发事件前可
能出现的征兆
(1)服务器面板报警指示灯亮起;;
(2)服务器系统性能参数接近临界值;
(3)监控软件发现系统异常;(4)营销
业务应用系统终端无法登陆;
2014·9甘肃·兰帅l
(5)营销业务应用系统终端应用速度慢,经常发生系统应用异常。
4.4现场应急处置措施
4.4.1生产服务器、应用服务器应急处理措
施(1)故障诊断与排查
了解突发事件影响范围、人员、现象、时间等因素,初步判断导致突发事件发生的原因;检查服务器相关日志文件,是否有错误日志记录;检查服务器性能参数(epu、内存、磁盘空间、报警信息等),是否达到临界值。
(2)恢复应用系统
由于配置参数不合理导致的突发事件,参照操作手册调整相应服务器的配置参数,优化系统后可恢复应用,必要时可重新启动服务器;对有双机热备服务器,将应用切换到热备机,恢复应用。对无热备机的服务器,选用备机安装操作系统,安装数据库及相应配置,恢复最新备份数据由数据库管理员负责导入,对应用的测试,至应用恢复正常以上操作均需有专人在旁监护,防止误操作等以外发生。
由于硬件故障导致的突发事件,尝试修复必须依照产品手册执行恢复操作,确认硬件损坏时,如有备用设备的必须及时更换;保修期内的故障服务器应联系厂商进行维修;必要时应联系厂商进行维修维护。
4.4.2 F5故障应急
确认故障发生在部署在相关地市的主站系统服务器及硬件设备。导致系统不能正常运行时,迅速通知相关维护部门处理故障。并启动业务应急预案。
4.4.3注意事项
(1)进行网络设备物理维护操作时必须配带防静电手环; (2)现场维护时,尤其是在机房维
护时,要严格遵守机房使用条例,例如不要在现场吸烟
等;
(3)故障处理时,如果涉及到其他部门时,要及时联系相关负责人,以尽快解决故障,恢复系统正常运行。 4.5主站业务应用
系统软件应急预案
4.5.1突发事件现象
1、危险性分析,可能发生的突发事件类型 (1)数据库故障,有可能引起数据异常、数据丢
失、应用运行速度缓慢、用户无法访问或应
用停止等;
(2)应用软件故障,有可能引起应用流程无法推进、应用运行速度缓慢、用户无法访问或应用停止等;
(3)人为误操作,可能引起数据异常、数据丢失、业务错误等。 2、突发事件发生的地
点、设备的名称主站业务应用系统机房服务器与客户端:主站业务应用系统数据库服务。
3、突发事件可能造成的危害程度将会造成该营销业务应用系统速度变慢,严重情况可导
致无法登陆系统,不能开展业务。 4、突发事件前可能出现的征兆 (1)主站业务应用系统
客户端应用速度慢,经常发生系统应用异常; (2)提示业务应用系统错误;
(3)进人数据库系统管理,连接数接近系统设定的最大值;
(4)服务器系统性能参数接近临界值。4.5.2现场应急处置
措施
223
甘肃省电机工程学会2014年度获奖优秀学术论文
集 1、故障诊断与排查
(1)了解突发事件影响范围、人员、现象、时间等因素,初步判断导致突发事件发生的原因;
(2)检查服务器、数据库、应用软件等相关日志文件,是否有错误日志记录;
(3)检查服务器性能参数(epu、内存、磁盘空间等),是否达到临界值;
(4)检查数据库性能参数(表空间、锁等),是否达到临界值; (5)检查应用
程序进程是否有异常;
(6)调查客户端用户是否有非法作业。
2、恢复应用系统
(1)数据库故障对于配置参数不合理导致的突发事件,参照操作手册调整相应数据库的配置
参数,优化系统后
可恢复应用,必要时终止部分用户连接或重新启动服务器;对于数据库死锁导致的突发事件,终止死锁进程,通知用户暂时退出应用系统,必要时重新应
用服务释放资源;
对于数据库文件损坏导致的突发事件,启动数据库到维护状态,选择最近备份的文件进行恢复,维护操作必须依照相关产品手册;
涉及数据库数据丢失、异常的事件由信息安全处置小组完成恢复工作。
(2)应用程序故障
对于配置参数不合理导致的突发事件,参照操作手册调整相应应用程序的配置参数,优化系统后可恢复应用;对于应用软件bug导致的突发事件,责成开发商在规定的时间内完善软件。
(3)人为误操作
对于人为误操作导致的突发事件,查明误操作的经过,修正误操作影响的数据与业务流程,必要时将系统恢复到确认的无误状态。
(4)客户端故障对客户端可进行系统恢复、优化、更新、升级等操
作恢复正常应用。 (5)必要时应联系厂商进行维修维护。
4.5.3注意事项
1、切忌随意采用重新启动操作系统、业务进程的操作;
2、定期备份业务数据;
3、业务程序变动后需要备份;
4、业务配置变动后需要备份;
5、注意保护数据安全;
6、主站业务应用系统网络应急预案。
4.5.4突发事件特征
1、危险性分析,可能发生的突发事件类型系统全部或部分网络中断,主站业务应用系
统应用终端无法访问营销业务应用服务器。 2、突发事件发生的地点、设备的名称 (1)
机房网络交换机、光电转换器(协议转换器)、通讯通道等故障;(2)主干网络故
障;
(3)各终端网点网络故障;
3、突发事件可能造成的危害程度将会造成该营销业务应用系统网页浏览速度变慢,严重情况
可导致无法登陆系统,不能开展业
务。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。