印度 :如何应对天灾人祸?
来源:IT168 更新时间:2012-04-14

 在面临IT危机的时候,我们要透过危机的表面现象,查找到引起危机的真正根源,从根源上真正将危机解决。无论是技术性还是管理性问题,解决办法莫不如此。
  在印度著名的软件服务出口商Mphasis的IT部门,风险主要集中在业务流程外包(BPO)操作上。为了缓和公司面临的风险,该公司与其客户实行连续性的计划。另外,该公司的IT部门使用了一个多层标签交换MPLS网络来连接其国内的其他分支机构。在最后一公里接入方面,Mphasis采取了冗余保护,采用两种不同的传输媒体互为备份,在其中一条出问题的时候,另一个条线路还可以让业务保持正常。这些应对措施令其不仅能轻松应对来自人为的风险,即使发生了台湾地震那样的自然灾害,Mphasis的CIO也能高枕无忧,他就是这样给我们讲述了两个应对自然灾害的故事。

  两项改进应对资源危机

  尽管应对措施非常完善,我们还是曾经面临过一次非常严重的网络资源耗尽危机,很多网站遭受着被中断的危险。后来,我们发现我们的冗余设计在服务商接入点POP上存在问题,在其上联处只有一个路由器。这意味着连接到这个特定MPLS服务商接入点POP的网站被影响了。

  幸运的是,我们在班加罗尔有一个24x7x365工作的全球网络运行中心,它可以全天24小时地监视我们网络的运行情况。它发现了这个问题。而且由于我们及时采取措施,我们不用再去求助于我们的灾难恢复计划了,该计划将在灾难发生4小时后启动。

  根据这次事故的经验,我们采取了两个改进措施:首先,我们在服务商接口地方进行了冗余设计;另外我们还将最后一公里接入的其中一条线路转移到第二个服务商接入点上。这种级别的设计很容易,同时也让我们的网络可以一直保持不出问题。

  双层ATM环的保障

  我们的系统经常遭受到来自大自然的考验。2004年发生的海啸影响了其中一条线路,在另一条线路保持顺畅通信的情况下,我们顺利恢复了出故障的线路。另一次是最近台湾的地震,这次地震对我们的网络造成了一定威胁,但是我们把所有数据的路由从太平洋线路无缝地切换到了大西洋的线路上,因此这中间没有一分钟的断线。

  因此到现在为止,我们还没有面临任何真正的危机。

  我们可以实现这些事情是因为我们的网络是一个具有冗余线路的双层ATM(异步传输模式)环。这意味着我们使用了不同的线缆系统,可以在发生意外情况的时候可以自动切换系统到没有故障的线路中。

  我从风险降低中所学到的最重要的东西是,IT危机需要从源头上解决。CIO们不应该在签订了一个合约后,整日担心其风险的发生,而应该在危机发生后,甚至危机发生前就从源头上将其彻底解决掉。

  点评:从印度软件服务出口商Mphasis的IT危机解决经验中,我们知道在面临IT危机的时候,我们要透过危机的表面现象,查找到引起危机的真正根源,从根源上真正将危机解决。无论是技术性还是管理性问题,解决办法莫不如此。