APP下载

机场信息系统搬迁过程的风险控制研究

2014-02-16杨建伟

关键词:预防措施信息系统机场

杨建伟

(成都双流国际机场股份有限公司机电设备中心, 四川 成都 610202)

机场信息系统搬迁过程的风险控制研究

杨建伟

(成都双流国际机场股份有限公司机电设备中心, 四川 成都 610202)

机场信息系统是核心生产系统, 涉及面广, 设备众多, 相互联系复杂,机场迁址、扩建等项目中都可能需要对信息系统进行整体搬迁, 需要保证业务系统在规定的搬迁时间窗口内恢复正常运行. 分析了机场信息系统机房搬迁过程的各种风险, 提出预防措施及风险发生后的应对措施, 以及实施这些应对措施所需要的成本, 时间.

机场信息系统; 机房搬迁; 风险控制

机场信息系统搬迁过程涉及机场内外部很多方面, 在搬迁过程有很多不确定因素, 不可能规避所有的风险.因此, 我们需要识别所有的风险; 分析每种风险发生的可能性以及风险发生后对业务系统造成的损失; 制订措施预防风险事件的发生, 及发生风险后的应对; 估算实施这些措施需要的成本和时间, 在有限的经费、人力资源和停机时间的情况下寻求一个风险最小的搬迁方案.

1 机场信息系统搬迁过程风险控制模型

1.1 机场信息系统搬迁项目的生命周期

通常情况下, 一个完整的机场信息系统搬迁过程主要体现在四个阶段[1], 包括“识别搬迁需求、提出搬迁解决方案、执行搬迁、结束搬迁”, 这四个阶段构成了机场信息系统搬迁过程的整个生命周期. 如图1所示.

图1 机场信息系统搬迁生命周期Figure 1 Life Cycle of the Airport Information System during the Relocation

识别需求阶段是搬迁生命周期的初始阶段, 需要明确搬迁的任务, 制定出信息系统搬迁的细节计划; 方案解决阶段是在识别需求基础上所进行的一系列有针对性的搬迁实施计划; 执行搬迁阶段是对搬迁的解决方案的具体实施; 而搬迁结束阶段则需要对搬迁过程中产生的文档、试运行情况进行总结, 完成搬迁的决算等.

由此分析可见, 机场信息系统搬迁的整个生命周期内任一阶段的重大缺陷或失败, 都将导致整个搬迁任务的失败. 这种串联的特点决定了其风险控制的过程也具备流程的特点.

1.2 机场信息系统搬迁过程的风险控制模型

为了降低机场信息系统在搬迁过程中的风险, 最有效的方法就是对信息系统搬迁过程的整个生命周期内的每一环节进行风险的有效控制与管理[2]. 系统搬迁后可能会发生硬件、网络、操作系统、数据库、应用软件等故障. 风险管理的第一件事就是识别系统的脆弱性[3]. 系统搬迁中常见风险如1表所示[4]:

表1 机场信息系统搬迁中常见风险Chart 1 Common Risk during the Relocation of Airport Information System

3 系统故障 无法进入系统 键盘、鼠标、显示器、网络、文件系统、丢失密码 中 大4 集群故障 无法启动集群 网络、存储、串口、逻辑卷、配置 小 小5 数据故障 数据库异常 磁盘、逻辑卷、文件系统、网络、数据丢失 小 大6 软件故障 应用软件无法启动或工作异常 文件系统、网络 小 小7 超时 无法在规定的时间窗口内完成搬迁, 或没有回退时间弱电系统不能按期完工, 备份、恢复和拆装占用过多时间 小 大

为了降低以上风险的发生, 需要加强各阶段的风险控制, 具体分析如下:

机场信息系统主要包括地面信息系统、离港系统、航显系统、广播系统、安检系统、安检信息系统、客户系统、POS系统数据、安防系统[5]. 涉及不同生产厂家的不同产品, 不同的系统可能是由不同的应用软件商开发,不同的系统集成商实施. 因此, 在识别需求阶段, 除了做好这些系统的搬迁需求分析外, 还要加强搬迁的责任心教育、做好搬迁的各项论证、编制科学合理的搬迁预算;在提出解决方案阶段, 根据搬迁的信息系统特点, 关注导致风险产生的技术因素, 审核承担搬迁的单位资质、搬迁流程的监控环节, 以减少搬迁持续过程中的各种风险;在搬迁执行阶段, 要重点关注对搬迁的现场管理. 由于搬迁中技术难度大、专业分工多, 需要搬迁管理人员统筹安排, 减少由于人员带来的风险; 在搬迁结束阶段, 关注搬迁的决算, 避免增加成本, 加强对搬迁文档的管理[6].

综上, 对机场信息系统搬迁过程的风险控制模型如图2所示:

图2 机场信息系统搬迁过程的风险控制模型Figure 2 The Risk Control Model during the Relocation of Airport Information System

2 机场信息系统搬迁风险及其预防

根据上述风险控制模型, 具体分析机场信息系统搬迁过程中可能出现的风险, 从搬迁的生命周期思想出发,提出风险发生后的应对措施以及这些措施的成本、实施需要消耗多少搬迁窗口时间, 目的是回避风险、转移风险、减少风险造成的损失、降低风险的等级[7]. 主要的故障及其预防措施分析如下:

2.1 硬件故障及预防措施

(1)灰尘导致设备损坏

在系统搬运过程中, 由于震动, 一些灰尘可能进入插槽、光纤或设备的光口、, 导致搬迁后故障. 应对措施是在设备拆卸后, 重新安装前进行机箱内部清洁. 一般采用毛刷、吸尘器、鼓风机等工具, 也可能会使用一些清洁剂. 需要占用停机窗口的时间, 需要高水平硬件工程师实施, 额外的成本很小.

(2)搬运过程导致设备损坏

如果在搬运过程中失手摔坏, 或在楼梯、墙角上碰撞, 都有可能造成设备损坏, 预防措施是精选强壮的搬运工, 并安排人手在搬运线路上指挥调度. 该应对措施不会多消耗搬迁时间窗口, 需要人员占用, 没有额外的开销.

(3)运输过程导致设备损坏

在汽车运输过程中由于颠簸或车祸对设备造成损坏. 预防措施是购买海绵垫子, 铺设在货车上, 用绳子捆

绑牢实, 并派遣IT管理人员随车押运, 随时提醒司机慢行或选择平坦路面. 极其关键的设备还可购买单次运输保险. 该预防措施可能会略多消耗搬迁时间窗口, 需要人员占用, 额外的开销就是包装材料和保险费用.

(4)环境变化导致设备损坏

老机房温度非常低, 运输途中湿度非常高, 导致水蒸汽在电路板凝结, 重新通电导致损坏. 应对措施是调高新机房的温度, 调低湿度, 并在通电前静置一段时间, 静置时间越长风险越小, 静置24小时后将这项风险彻底消失. 需要占用搬迁时间窗口, 一般不可能有24小时的静置时间.

2.2 系统故障及预防措施

(1)设备装配错误导致系统不能正常启动

系统重新装配后, 可能不是100%还原, 导致系统找不到指定的设备, 系统启动不正常, 排查和修复故障需要消耗搬迁时间窗口. 预防措施是搬迁前对系统进行标识, 按事先设计的编码对设备贴标签, 包括设备名称, 每一个端口及电缆、光纤都需要标识.

(2)网络环境不同导致系统异常

预防措施是在搬迁前对新机房网络环境进行全面的测试, 确保网络环境一致. 紧急情况下需要应急备机.不占用搬迁时间窗口, 需要网络工程师, 租用或购买应急备机可能产生额外费用.

2.3 集群故障及预防措施

集群故障可能是由于硬件故障、或配置引起的. 预防措施是在健康检查时进行集群切换测试, 确保集群配置没有问题. 需要数据库管理人员实施, 不占用搬迁时间窗口, 没有其它人员和费用.

2.4 数据库故障及预防措施

(1)数据库系统故障

导致数据库故障的原因很多, 可能因磁盘损坏, 逻辑卷错误、文件系统故障、开关机过程中的错误操作、数据中错误的设置等原因造成的. 预防措施:搬迁前进行健康检查, 关机前先确认数据库已经正常关闭, 搬迁后不要急于启动双机或数据, 再进行一次系统级健康检查, 确保硬件、网络和操作系统一切正常后再启动数据. 需要系统管理人员、数据库管理人员参与, 健康检查需要占用搬迁时间窗口, 没有其它费用[8].

(2)数据损坏

由于磁盘、阵列等损坏导致数据损坏, 数据丢失, 应对措施是在搬迁前对数据库进行备份, 一旦发生数据库损坏, 可通过恢复操作修复数据. 要消耗停机窗口时间, 以及数据库管理人员操作.

2.5 应用软件系统故障及预防措施

(1)网络设置错误导致应用系统异常

可能是由于IP地址改变、路由设置、防火墙设置不正确、中间件服务器变化、负载均衡器设置不正确等因素引起. 预防措施是尽量不要在搬迁项目中修改网络设置.

(2)客户端设置错误导致应用系统异常

一般情况应尽量避免修改客户端配置, 在服务器端修改量很小, 而客户端修改量非常大.

2.6 超时故障及预防措施

超时故障是指不能在规定的时间窗口内完成搬迁工作, 系统不能提供服务导致业务中断. 超时造成的损失与业务有关, 如果机场关闭, 业务损失巨大, 建议采用一些技术手段尽量减少停机时间. 超时主要是因为意外、太多故障处理、备份及恢复导致的[9].

3 机场信息系统搬迁风险控制

通过对可能发生风险的分析评估, 我们发现所有的风险都可以通过采取一些预防措施进行规避、转移、降低风险. 有些预防控制措施需要很多人力资源, 有些措施耗资巨大, 但跟停产造成的业务损失来比就太小了, 所以需要决策人员智慧的选择.

我们采用的风险控制措施主要在3个方面:组织措施、技术措施、安全措施.

3.1 组织措施

成立搬迁项目指挥部, 建议由副总裁以上的组织能力超强的人员担任指挥长, 由机场、航信、系统集成商、软件开发商、各子系统供货商、服务商、搬运公司联合成立搬迁项目组, 另外聘请首都机场有丰富搬迁经验的专家担任顾问. 为简化管理, 与软件开发商、各子系统供货商、服务商之间的协调由系统集成商负责.

选择合适的搬迁时机, 制订完整的总体搬迁计划, 绘制横道图和网络图. 各分系统责任单位通过编制次级进度计划, 通过专家会议论证进行评审, 确定总进度计划; 系统集成商负责细化次级进度计划, 进一步明确各分项工作所需的资源, 以及完成该项所需的时间, 并验证总计划的合理性.

根据搬迁进度计划确定各种资源需求计划, 具体的计划总量及进场时间, 并保存“资源需求计划”编制的依据和基础数据, 以备查询和满足施工过程中持续改进的需要[10].

3.2 技术措施

通过制定完整的搬迁方案, 细化每个搬迁环节和预防措施的详细步骤, 确保搬迁过程能正确实施. 根据有限的人力、物力、财力、时间等资源, 选择实施各种风险控制的技术措施, 使搬迁风险降到最低[11].

3.3 安全措施

成立机场搬迁安全小组, 由副指挥长担任安全小组的组长, 安全小组负责制订安全防范措施及要求, 在搬迁现场设置警戒, 对搬迁现场安全进行监督与检查, 规范检修行为, 制止违章操作, 保证搬迁和周围安全生产安全进行. 落实搬迁现场安全防范. 搬迁作业前对所有参与搬迁人员进行安全培训[12].

彻底评估搬迁工程的重点、难点, 成立攻关小组, 提前进行调查研究, 及早提出解决方案. 规避风险, 确保工程顺利完成.

4 结语

本文提出一个机场信息系统搬迁的生命周期风险控制思想, 对风险控制与搬迁过程管理整合提供了一种有效的管理与控制方法, 为实际的机场信息系统搬迁过程的规范化实施提供了参考.

[1] 郭捷. 项目风险管理[M]. 北京: 国防工业出版社, 2007.

[2] 沈建明. 项目风险管理[M]. 北京: 机械工业出版社, 2009.

[3] 马丁鲁斯摩尔. 项目中的风险管理[M].北京:中国建筑工业出版社2011.

[4] 包金玉. 定量和定性风险评价方法分析 [J]. 大连海事大学学报: 英文版, 2008(增刊2): 5-8.

[5] 傅鸿源. 工程项目风险评价方法的研究[J]. 系统工程理论与实践, 2003, 10-17.

[6] 孙军. 工程项目风险的特点与识别[J]. 科技咨询导报, 2007(10): 172-175.

[7] 赵涛, 李英. 多目标整数规划在环境风险控制模型中的应用[J]. 科学技术与工程, 2011, 11(34): 8649-8652.

[8] 卢加元. 基于可靠性理论的信息化项目建设风险控制模型[J]. 科技管理研究, 2009, 4: 136-138.

[9] 梁新弘. 论信息技术(IT)外包的动因、风险及防范[J]. 科技管理研究, 2004(1): 64-66.

[10] 蒋敏, 胡奇英. 一种风险值最优控制模型[J]. 西安电子科技大学学报: 自然科学版, 2006, 33(1): 142-144.

[11] 梁丽琴, 邵培基. 国内外信息技术外包研究现状及趋势对比分析[J]. 中国管理科学, 2008,10(16): 486-491.

[12] 郑新定, 王红卫. 考虑人为因素的盾构隧道风险分析和控制模型研究[J]. 隧道建设, 2013, 33(9): 720-724.

Risk control during the relocation of airport information system

YANG Jian-wei
(Mechanic and Electrical Equipment Center, Chengdu Shuangliu International Airport Company LTD, Chengdu 610202, P.R.C.)

Airport information system, which involves a wide range of, numerous equipment, in complex relationships with other system, is the core of production system. When the information system must be moved for things such as airport relocation or extension, it should recover to work in fixed time. This paper analyzes various risks in the process of the information system relocation, points out the prevention measures before and after the risk occurs, the cost and time it needs.

airport information system; computer room relocation; risk control

TP309

: A

: 1003-4271(2014)03-0461-04

10.3969/j.issn.1003-4271.2014.03.25

2014-03-06

杨建伟(1969-), 男, 四川都江堰人, 工程师, 硕士, 研究方向: 信息技术.

猜你喜欢

预防措施信息系统机场
机场罢工
初春仔猪腹泄原因与预防措施
企业信息系统安全防护
房建过程中电气安装中常见问题及预防措施
如何避免GSM-R无线通信系统对机场电磁干扰
核桃园自然灾害预防措施
机电设备故障维修及预防措施探讨
基于区块链的通航维护信息系统研究
航Sir带你逛机场——东京国际机场
面部识别使机场安检提速