中国民航信息网络股份有限公司离港系统发生故障,导致国内部分机场航班无法办理值机手续,大批旅客滞留机场。
10月10日,北京,一连串急促的电话声打破了中国民航信息网络股份公司(简称“中国航信”)的平静,因为电话中传来的都是不好的消息:
首都机场,13时28分起,离港系统瘫痪50分钟,33个航班延误,近千名旅客滞留;
深圳宝安机场,13时33分起,离港系统瘫痪44分钟,25个航班不能正常办理登机手续;
广州新白云机场,13时35分起,离港系统瘫痪45分钟,7个航班直接受影响,乘机手续改为手工办理;
此外,长沙、福州、厦门、上海等地机场也因离港系统故障,不同程度受到影响。事实上,这并不是国内离港系统第一次出问题。资料显示,今年1月11日上午10时30分至11时10分,包括成都、上海、北京在内的全国多家机场就曾因此无法正常工作。无独有偶,10月10日凌晨,香港机场也因离港系统故障持续超过6个小时,导致15个航班延误。
面对国内机场离港系统如此大规模的“离岗”行为,人们不禁要问,离港系统如何运营?故障频出原因何在?更让人深思的是,民航IT系统果真弱不禁风吗?
“离岗”原因多主机嫌疑大
离港系统突然“离岗”,引起业界诸多猜测,主机故障、通信线路故障和人为误操作都可能是“离岗”原因,但业界目前普遍认为,主机故障嫌疑最大。
这还得从离港系统自身说起。离港系统(Departure Control System,DCS),是现代化机场必备的大型实时计算机系统,一般分为旅客值机(CKI)、配载平衡(LDP)、航班数据控制(FDC)三大部分。在我国,民航离港系统始建于1988年,是中国航信的前身民航计算机中心引进美国Unisys公司的USAS产品建造。时至今日,国内已有超过140家机场的离港系统都由中国航信运营。
据中国航信内部人士介绍,中国航信的离港系统是基于大型主机的集中式系统,分为前后两部分。后台是设在中国航信北京总部的主机系统,所有数据的处理最终都在主机上完成;前端系统则设在使用中国航信离港系统的各个机场,它们通过长途通信线路与主机保持联系。正是由于主机和前端系统要实时地、频繁地交换数据,而且离港往往有时间限制,因而对离港系统提出了很高的要求。
在这个集中式的系统架构中,主机由中国航信负责维护,通信线路由网络运营商负责,前端系统的使用权则在机场手中,于是离港系统故障的原因主要来自这三方面。
主机出现问题,各地数据都无法得到处理,影响将最为巨大。“因而我们每年投入2000多万美元来升级系统,有上百人在维护主机的运行。”中国航信某技术人员感慨道,“尽管目前主机的安全级别已经达到99.99%以上,我们仍然担心主机出问题。”
通信中断也是离港系统故障的顽疾之一,地理、气候、人为因素都可能使通信受到干扰。例如2004年8月19日,由于沈阳一开发公司施工时不慎将通信光缆挖断,曾导致沈阳桃仙国际机场的离港系统全部瘫痪。为了保证传输安全,中国航信表示,他们已经采取多种措施,包括使用专线光缆,同时采用多家运营商线路进行备份等等。“但真要是线路有问题,我们也没办法,这得由运营商负责维护。”中国航信技术人员说。
另一方面,机场工作人员的误操作也可能引起当地离港系统的崩溃。据了解,国内某机场就曾经因为工作人员将用于验证的密码文件误删除,导致当地离港系统无法获取信息而陷入瘫痪。不过,这种人为误操作影响范围只限于当地机场。
可见,问题可能来自整个离港系统的各个环节,责任也不一定就由中国航信一家来承担。截止发稿时为止,民航总局和中国航信还没有公布本次事故的原因,但由于本次事故在同一时间内涉及全国各大机场,因而各大媒体和业内人士普遍认为主机故障的嫌疑最大。“要么是主机有问题,要么是主机与各地通信的必经线路有问题,否则不会有这么大面积的影响。”业内专家强调。
备份系统理论与现实有差距
“怎么可能没有备份?!”当被问及离港系统是否有完善备份机制时,中国航信的技术人员如数家珍对记者道来。
据介绍,对于主机系统,中国航信在北京有备份主机。“备份主机的要求是很高的,对于订座系统,我们要求是比特级的备份;而离港系统要求更高,要求实时备份,一个比特都不差。”
而对于前端系统,并不要求统一由中国航信提供。中国航信自主研发的前端系统是NewApp系统,而首都机场用的是Ulead公司的系统,杭州机场用的是英国的一套系统。打个比方,就像三星、诺基亚的手机都可以接入中国移动的网络一样。不过,无论前端系统是什么,最终还是要接入到中国航信的后台主机系统中进行数据处理。
据了解,NewApp最大的特点在于具备双机热备份功能,也就是说,当离港系统与主机连接时,NewApp将先把存贮在主机上的旅客信息下载一份到本地备份,如果此时突然与主机失去联系,NewApp将平滑地切换至本地备份模式下,继续利用事先下载好的旅客信息办理值机手续,从而最大限度地保证正常工作。
在本次事故中,NewApp的备份功能已经发挥作用。据中国航信内部人士透露,广州新白云机场启用的应急系统正是NewApp自带的备份系统,从而将受影响航班数降到只有七个。不过这些备份功能无法惠及国际航班,因为它们的旅客信息存在国外航空公司的主机上,而并不存储在中国航信的主机中,无法用NewApp事先备份。
“在上述备份系统下,理论上是应该快速完成切换的。”中国航信技术人员强调。然而“理论上”也只存在于理论情况,事实上人们还是看到近一小时的瘫痪时间。理论和现实的差距摆在眼前,这又是为什么?据业内人士分析,其中有一大部分时间来自于人为决策的时间。当前端系统发现与主机通信不畅时,技术人员需要花时间确认,如果系统能够自恢复,则不用切换备份。而当主机发生故障时,也得花时间分析判断,毕竟切换备份不是件小事。
统一平台 是利是弊
牵一发而动全身,这就是本次中国航信离港系统故障的最好写照。全国如此多的机场受到影响,正因为目前国内离港系统绝大部分由中国航信独立运营。
统一平台下的高度信息共享的确带来了更好的服务。以联程值机为例,在统一的离港服务平台下,旅客可以在多个航空公司的航班中转后到达目的地。由此旅客可以在始发站打印多航段登机牌和直达行李牌,而在中转地不需要再次办理乘机手续和提取行李。另一方面,航空公司则可以在信息化的帮助下然而,正因为中国航信一家独做的局面,每次离港系统出故障,人们都不约而同地将目光聚集于中国航信。随着国内民航业的发展,信息越来越多,特别是电子客票广泛展开以后,数据量将会成倍增长,系统环节会不断增多,这种集中式的信息管理模式带来的是巨大的风险,各个环节的问题都可能带来连锁反应,从而导致整个系统的崩溃。另一方面,服务商太少意味着没有竞争,没有竞争往往意味着缺乏前进的动力,而同质化的服务也让各航空公司无法根据自身业务特点及发展方向增加相应的功能。这些都让人们对中国航信表示怀疑。
事实上,过去曾有多家航空公司试图建立自己的离港系统,但都陆续放弃。东航虽然建成,但由于订座系统还由中国航信提供,东航的离港系统也依然要从中国航信预先获得订座信息才有用武之地。直到2005年10月,春秋航空同时开发出自己的订座系统和离港系统,才算有人真正从中国航信的系统中独立出来。
不过换个角度考虑,如果每个航空公司都建立自己的订座、离港系统,那么售票处就得切换多个系统,而办理值机手续也只能到特定柜台,是否会更不方便呢?
对此,中国航信的内部人士表现得很坦然:“由于历史和体制的原因,这个市场出现平台大一统的局面,但在以安全为首要目标的航空业,这也意味着我们的责任更大。”他甚至这样对记者形容:“24小时手机不关,就像顶着个定时炸弹睡觉,这种滋味你试试!”