北京电力携手北塔构建市县二级网络运维平台
来源:中国电子政务网 更新时间:2012-04-15

  背景

  北京电力公司作为国有特大型供电企业,主要负责北京地区的电力供应、销售和输电、变电、配电设施的建设,同时承担着保障首都安全供电的政治责任和为北京地区经济发展提供可靠电力供应与服务的使命。北京电力公司以建设运营北京地区电网为核心业务,下辖二级单位34个,其中区(县)供电分公司16个。北京电力信息网络历经过多次升级改造,目前公司本部机关局域网设备以北电设备为主,局机关到各二级单位的广域网链路,以思科设备为主,各二级单位则兼有北电、思科、华为等多个厂家设备。在前几期的网络建设中,曾为公司本部配备了HP Openview、CiscoWorks等国外厂商的管理系统,可管理到局机关的大部分局域网和广域网设备。

  随着北京电力信息网络规模的不断扩大,所采用的网络技术日益复杂、网络设备也日趋多样化。全公司的各项业务系统对计算机网络和IT基础平台的依赖性越来越高,对于网络系统的可用性和稳定性提出了更高的要求。原有国外厂商的管理软件或是局限于对设备的配置管理,或是缺乏有效的管理手段,致使无法对公司网络资源配置及流量分布实施有效管理。同时,由于北京电力已有网管系统仅负责局机关的网络监控,未能实现对各二级单位网络的统一管理,使得北京电力信息中心所面临的网络运维管理压力,与日剧增。

  鉴于北塔网络公司拥有多年在国内各行各业IT运维管理实践的丰富经验,以及北塔咨询式销售方法和对于行业客户需求的准确把握,北京电力决定采用基于北塔网络公司的北塔网络运维管理系统BTNM的市县二级网络运维管理解决方案。

  用户需求

  北京电力对此次方案提出了以下几大需求:

  异构平台的全面管理——在北京电力之前的网络建设中,曾经为信息中心配备了Cisco Works以及Nortel Device Manager等设备厂商的管理软件。由于设备厂商的管理产品仅限于网元级管理,通用性不强,已远远不能满足当前基于异构平台的复杂应用环境的管理需要。“与设备厂商提供的管理工具相比,我们的网管系统需要进一步改进。否则用不了多久,多个并存的管理孤岛将造成不可想象的后果”,该公司的信息主管表示,“我们再建的网管系统,必须要具备强大的跨平台管理能力,包括设备平台、系统平台和应用平台……”。

  分支机构的统一管理——在2005年,北京电力信息中心将IT运维管理关注的焦点转向了面向公司本部及众多下属单位的管理融合上。当时,公司本部和下辖的三十多个二级单位已分别建立起了自身的信息网络系统,并通过广域网络进行互联。“过去,我们只是担心如何与各下属单位在网络上互联互通;今后,我们将更加关注如何与各下属单位在管理上互通互融。只有实施全盘的管理,才可能将所有的信息整合到一个统一的、融合的管理平台当中。”

  网络故障的事前管理——作为承载北京电力各项业务系统的IT基础设施,网络平台需要面向公司的营销管理系统、人事管理系统、财务管理系统、战略规划系统、工程管理系统等各种专业信息系统提供持续可靠的网络访问服务。公司信息中心也非常重视不断增加的故障隐患和安全威胁(包括蠕虫、病毒和黑客)对于网络平台稳定运行带来的冲击。因此,要帮助北京电力实现管理创新的目标,一个关键因素就是要及时发现网络中的潜在问题和安全隐患,以便提前制止可能的攻击行为和异常事件,消除病毒和蠕虫所带来的系统漏洞和潜在风险。

  突发事件的应急管理——IT系统面对突发事件的管理能力体现着管理系统的抗风险水平。面对网络系统层出不穷的各类突发性事件,如何进行事件的自动通知,如何对告警事件进行整合与相关性分析,自动启动相应的故障恢复机制和事件联动机制,将网络故障带给业务系统的损失降到最低程度,是北京电力信息中心的运维工作所面临的又一大挑战。

  解决方案

  为了更好的满足北京电力对于上下级单位管理融合的需求,保持他们在技术应用方面取得的领先优势,北塔网络公司为其提供了一个基于北塔网络运维管理系统BTNM(Before Trouble Network Manager)产品的强大、永续的运维管理解决方案,其中包括强大并可扩展的管理基础平台、具有集成安全管理的网络地址簿、灵活而丰富的报表展现模块和基于Dataflow/Netflow/Sflow的数据流分析模块。BTNM系统面向本部机关和各二级单位网络的分布式部署与层次化展现,帮助北京电力实现了对所有下级单位信息网络的统一管理:

  (一)面向异构平台的集成化管理

  北京电力网络运维管理系统的部署,必须面向公司本部和下属区县供电公司的各种交换/路由设备、网络安全设备、主机/服务器、环境监控设备、电源保障设备以及网络流量,实施统一的监控与管理。其中,不仅包括思科、北电从低端到高端的十余款网络交换机、路由器,Juniper、华为、3COM等多个厂家的网络设备,还涵盖了Windows / Linux / IBM AIX / HPUX多种操作平台、SQL Server / Oracle数据库以及Weblogic中间件等。

  BTNM系统在北京电力的部署中,通过全面支持SNMP的v1/v2/v3标准,根据北京电力的管理实际需要,采用多种算法并设置相应的扫描范围和搜索深度,生成与网络情况相吻合的网络拓扑视图,将所有的被监测对象依照连接关系添加到拓扑视图中,从而把异构的网络平台纳入了统一的管理视角。BTNM产品对于异构平台的管理集成了SNMP get/trap/work/scan、Syslog、SSH、Agent、WMI等多项监测手段。对于北京电力某些不支持或不开放SNMP协议的被管理对象,BTNM提供基于SSH 和Telnet的自定义监测方式。BTNM系统可选择使用SSH和Telnet协议登录到被管理网元,自动下发和执行预置的命令脚本,并接收脚本返回的数据信息,大大扩展了对于异构平台的监测范围和类型。

  BTNM面向异构平台的集成化管理,高效集成了传统的网络管理、系统管理和应用管理,提供覆盖各种网络设备、主机服务器、数据库、中间件、通用软件、专有设备及专有业务系统的各种监测器。BTNM系统通过将不同类型的监测器获得的管理数据进行多角度多层面的综合分析,汇总出企业关心的信息网络整体运行状况视图,从而更好的帮助信息中心全面了解和预测企业当前的IT运行环境。

(二)面向分支机构的层次化管理

  在帮助北京电力建设面向全局的运维管理体系中,不仅要优化本部机关园区网络的管理,更要考虑到全市各区县下属单位为数众多广域节点的管理。在这种情况下,采用传统的平面型网管结构无疑会使得SNMP管理器成为性能瓶颈;过多过频的轮询和分布愈来愈广的代理,不仅会加重广域链路管理带宽的整体开销,又要耗费掉运行SNMP管理器计算机的大量处理时间,致使网络管理效率全面下降。

  北塔网络运维管理解决方案充分考虑到平面型管理结构的弊端,而在北京电力各区县下属单位部署了中间层管理器。通过BTNM产品的分布式部署,实现了全公司信息网络的层次化管理结构。BTNM的层次化管理结构可使各下属单位信息网络的数据采集和运维管理均在本地完成,经过各个中间层管理器汇总后的拓朴数据、事件信息和性能数据统一上传到为于机关本部的中心网络平台。

  通过BTNM产品的层次化管理,不仅为各区县级单位配备了功能强大的运维管理平台,并进一步扩展了本部机关的管理范畴。信息中心的管理人员可在机关本部直接调阅下属单位的网络拓扑视图,随时了解各区县网络的运行状况。在这一架构下,区县网络系统的重要事件告警可在第一时间直达本部网管中心,而当各下属单位网络发生故障时,市信息中心还可通过中心平台远程帮助排查问题,解决故障,提升了全公司的运维管理水平。

  (三)面向网络故障的事前管理

  网络事前管理作为BTNM产品的核心理念,在此次的北京电力网络运维管理系统的部署中得到了更加客户化的展示。由于在管理人员日常的维护工作中,很难预期未来故障的爆发时间和具体位置,往往造成了在网络出事之后匆忙救火、疲于应对的被动局面。北塔的BTNM系统将北京电力信息网络的各个管理对象(路由器、交换机、服务器、防火墙、主机、网络链路等) 视为网络健康的“传感器”,通过监视这些感应器的运行状态和性能参数(如CPU、MEM、流量负载等) 的变化情况 ,并将其动态投影为拓朴视图中相应的颜色变化,便于管理员一目了然的掌控整个网络的实时运行状态。当某项监测参数发生异常时,系统可使用醒目的颜色和直观的状态图标提醒管理人员进行关注,配合系统提供的网络设备性能分析、地址定位等功能来提前进行异常事件诊断,从而达到了防患于未然的目的。

  北京电力在BTNM管理平台的基础上,进一部规范管理流程,实现了网络运维从“事后堵漏式补救”向“事前主动式管理”模式的转变,信息中心的管理压力也得到了有效缓解。

  (四)面向突发事件的告警管理

  故障告警管理是网络运维管理系统的核心,告警信息的及时与准确是网管系统能否够发挥应有作用的重要保证。BTNM系统能够对IT网络及系统的各类突发事件产生的事件信息和告警信息进行整合和自动化处理。利用Syslog接收器获取相关设备转发的Syslog信息,利用SNMP Trap接收器获取设备或第三方管理工具的事件告警信息,并可实现基于策略的事件过滤和相关性分析。

  BTNM系统提供丰富的告警类型,涵盖网络告警、管理告警、主机监视、应用监视、流量监控多个层面。对于各类突发事件,系统可采用灵活多样的告警方式及时通知信息中心管理人员,包括中文语音报读、控制台弹出消息、E-Mail、SMS、Windows信使多种方式,实现了全天候的事件自动通知。同时,通过BTNM内置的事件处理机制,配合管理员预置的事件联动措施,可实现对于告警的自动诊断与快速恢复,有效的增强了北京电力应对网络突发事件的处置能力。

  实施效果反馈

  北塔网络公司所提供的BTNM系统是集网络平台管理、数据流量分析和应用服务系统监控于一体的综合运维管理系统,一体化的平台架构符合新一代IT综合管理的趋势。在BTNM产品的解决方案中,提供了面向北京电力本部和各下属单位的整体管理视图。BTNM以网络平台为基础,将网络管理、系统管理、应用管理三方面的运行趋势统一映射为全公司信息网络的健康性和可用性。通过BTNM系统的全面部署,不仅实现了北京电力的管理目标,在提升信息中心管理效率的同时,充分保证了北京电力IT系统的可用性及可靠性,并可随北京电力业务系统的发展而扩展。

  随着北京电力公司调度、营销、市场各项业务的广泛地开展,BTNM产品当前所支持的网络系统管理模式,在今后可方便地扩展到面向服务的服务流程管理和服务级别管理,较好的满足了北京电力近期和远期的系统管理目标。