软件系统运维方案
1 运维方案
在各个应用系统投入运行后,系统进入运行维护阶段。
运行维护阶段的主要任务是保证系统正常运行,同时对系统运行状况进行监测和诊断,及时排除各种故障,在必要时对应用软件和系统软件进行升级。
自项目进入运行维护阶段开始,项目经理需要协调各项目组、各个业务部、技术部门,掌握系统运行中关键的技术环节和重要的业务需求,抓住系统运行的关键和重点,以提高整个应用系统运行的可靠性和可维护性,使之更加符合业务部门的实际需求并使之更加规范。
1.1 运行维护管理体系
为确保项目的正常运行,项目组汇同行业专家与顾问、采用业内成熟产品与技术、制定相应的管理流程,成立专门的运行维护组织,形成专业化的运行维护管理体系。确保该项目能够适应业务的深化与拓展、环境的发展及变化,以高效率、高质量、低成本、易管理的特为用户提供专注的运行维护服务。
根据公司运行维护管理策略,结合本项目特点,形成本项目专有的运行维护管理体系。该体系从规范管理制度、科学设置组织机构、制订运行维护计划、提供先进技术支持等方面进行阐述。具体运行维护的工作包括:制定总体运行维护方案、各应用子系统运行维护方案;进行日常运行维护与记录;对运行平台的维护建议、应用系统升级方案、应急事件支持措施等。
1.1.1 运行维护目标
系统运行维护的最终目标,就是在运行维护管理体系基础之上,提供一个可集中管理、开放维护、高度可扩展、快速响应的运行环境,实现所有与系统正常运行相关的资源能够获得集中管理和按需分配的目的。
具体运行维护范畴包括以下各项目:
具体涉及以下各个方面工作: 
运行准备工作:包括平台运行准备、基础数据准备等。例如:清除无关数据,系统数据设置(系统参数、门户风格、频道定制等);协助技术实施组,进行基本数据设置(员工基本
数据、部门基本数据、栏目基本数据等);相关业务数据移植(节目表、节目基本资料、人财物数据、设备调度基本数据、综合质量质量、版权数据)等等。
对数据库应用的监控:监控数据库应用的运行性能,包括数据库的并发用户、并发锁、共享内存的使用等;
对主要业务应用的监控:包括对各个应用子系统、邮件系统、FTP服务、消息中间件的主要性能参数的监控。
对于应急事件的支持:制定应急预案,确保发生系统故障、环境故障、操作失误、工作配合失误等各种事故时,能够在第一时间实施响应,快速调配各项资源配合应急工作并实施应急措施。
1.1.2 组织机构设置
为确保项目的正常运行维护,成立运行维护组专门负责对系统的运行维护进行管理。并且下设若干小组进行专项管理工作。具体组织情况及职责如下:
1、运行维护组
直接由项目经理领导,下设日常维护组、升级维护组、技术维护组、应急支援组。
主要职责:
主要负责总体的运行维护管理;
根据系统运行情况以及业务需要制订运行维护相关的总体方案及计划;
根据实际运行情况,定期或不定期的生成统计报表、总结报告等;
控制运行维护成本,并协助用户进行运行维护的成本预算;
掌握服务提供商的综合情况,并提供服务质量评价;
针对重大问题,组织协调各个运行维护小组的资源调配与沟通合作。
(1)日常维护组
由运行维护组直接领导,负责系统日常运行维护的相关工作。
主要职责:
依据运行维护方案,制定日常运行维护计划、问题管理计划等;
运行基础数据采集、整理、分析。根据日常运行维护计划要求,形成各类相关报告,如日常监测报告、状态监测报告、常规维护报告等;
定期或不定期的对应用系统进行系统和数据的备份与恢复,并填写备份/恢复记录;
发现并记录运行过程中产生的问题,形成问题清单,并上报给运行维护组。
(2)升级维护组
由运行维护组直接领导,负责系统升级维护、应用升级维护等相关工作。
主要职责:
依据运行维护方案,制定运行维护阶段的系统升级管理方案;
根据实际情况以及用户需求,在不影响应用系统的正常使用情况下,不定期的进行应用系统升级维护;
辅助用户完成环境迁移后的系统重新部署。
(3)技术维护组
由运行维护组直接领导,负责系统运行中故障的处理、运行环境参数配置、系统调优等工作。
主要职责:
运行维护管理环境搭建,辅助技术实施组进行基础数据准备;
在突发应急事件响应过程中,针对故障进行诊断与排除,并形成报告等技术文档;
运行环境参数设置,并形成相关配置文件;
系统性能优化处理等。
(4)应急支援组
监控系统软件
由运行维护组直接领导,针对应急事件、重大问题提供技术支援。
主要职责:
协助运行维护组制定重大问题预案、应急支持预案;
负责预案执行之前的各类设备及系统的预查;
负责预案执行期间的各类资源整合调配。
1.1.3 运行维护计划
当系统通过集成测试、人员培训、运行环境搭建等相关工作后,开始正式运行。公司承诺,自系统通过终验之日起需要提供年的保修和维护服务。为此,运行维护组将根据实际情况以及实际的需求, 制定运行维护管理计划,该计划将具体指导整个运行维护阶段的工作实施及推进。在实际执行过程中,将根据实际需要进行调整和完善。结合定期提交的运行维护管理情况总结,对下一步计划实行有效的调整和改进。
1.1.4 运行维护方式
本项目的运行维护方式主要以现场维护为主,远程维护为辅。
委派专业的技术支持工程师到项目现场提供服务。工程师置身现场环境,能够更加细致入微的体验系统运行情况,与客户进行面对面的交流探讨,能够更为可靠、有效地进行故障预测、问题追踪、异常排除、系统优化,并大为减轻对客户技术上的要求和维护压力。
情报中心技改项目主管领导可以根据实际情况和需求,选择由技术支持工程师协助完成短期或者阶段性工作。运行维护组下属的各个小组都会提供现场维护服务,具体如下:
日常维护组,将会长期驻扎在现场,进行日常的巡检、监控、备份等维护项目;
升级维护组将会不定期的到达现场,提供系统升级等维护项目;
技术维护组将会根据实际情况到达现场进行故障排查、系统调试等工作;
应急支援组将在发生重大问题或者应急事件的情况下,在用户现场24小时待命。
项目运行维护期间,运行维护组及下属各个小组除了完成各自职责范围内的工作之外,更需要相互沟通协作,共同完成维护任务。例如:日常维护组长期驻守在现场,如发现故障或者隐患,在采取日常维护处理手段仍无法解决的情况下,需要及时汇报给运行维护组或相关小
组(以问题清单的方式进行),确保整个运行维护团队的响应速度;技术维护组在进行故障修复或者系统完善的时候,对于系统的日常运行情况的了解和掌握,就需要与日常维护组进行充分的沟通与交流,减少不必要的成本投入,避免判断失误;针对重大事件的响应,就需要运行维护团队充分调度资源,共同协作以完成运行维护任务。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。