【编者注】注入大量资金搭建网络基础架构和成功实施PLM、 ERP和CRM等应用系统后,UAES开始考虑进一步深入信息化建设。这次,它们选择了SiteView ECC——综合系统管理。它的引进,是否能将UAES信息化之路推上另一个颠峰呢?
【IT168 应用方案】2005年7月10日凌晨三点,上海市浦东新区金桥开发区一栋大楼的灯还在彻夜不眠,陪同它们的还有几个正在忙碌中的身影。这里正是上海联合汽车电子有限公司(简称UAES)的总部,而UAES技术中心和上海生产厂也都建设在这里。
UAES是一个现代化的企业,整个上海厂区的信息系统有600~700台PC(将近一半是笔记本电脑),服务器、交换机、路由器和防火墙等加起来达70多台,T系统是整个企业正常运作的基本保证。截止06年初,联合汽车电子有限公司信息中心只有7人,系统维护和监控基本上依靠人工操作,工作非常烦琐,而且在出现了问题的时候也不能保证及时发现。
如何彻底突破“系统黑箱”?
因为没有自动、智能的IT管理工具,平时很多系统性能数据无法及时准确掌握,这些 “系统黑箱”终于导致7月10日这天下午五时业务部网络的局部瘫痪。缺乏预警机制,UAES信息中心不得不在网络故障出现后被动地去排查故障、分析解决。网络故障还在处理中,初步诊断结果,主要还是系统问题。至于具体系统哪里出现问题而导致网络局部瘫痪,还需进一步排查。
在N多可能导致系统问题的因素中逐一排查,即便根据经验从常见问题分析处理,恐怕下班前也解决不了,联合汽车电子有限公司信息中心IT总监仲强焦虑地想。虽然很着急,仲总监还是安慰大家,该庆幸是即将下班时问题出现,不然白天耽误业务部正常工作的话,影响更加严重。
然而在排查系统故障的过程中,运维工程师却又发现了不少其它潜在的故障隐患。为此,为此仲总监心里又是一紧:首先必须保证在第二天业务部上班前彻底解决问题,同时还要避免以后不会再出现类似的重大问题。那么,必须今晚就把这些故障隐患都处理掉,否则问题再积累难免又是大爆发。
所有的问题终于在凌晨四点钟得到解决,看着彻夜未合眼的弟兄们疲惫劳倦的身影,仲总监心里很不是滋味,必须找到一个好的解决方案,彻底突破“系统黑箱”。
一次意外的收获
上海是中国经济最繁华的城市,“东方明珠”孕育了其独特的文化。上海的学术氛围很浓,这里的CEO、信息主管经常组织研讨会交流经验,或者相互参观考察成功项目。一次偶然的机会,联合汽车电子有限公司信息中心的IT总监仲强应邀到“中国上海”政府网参观其网络局部升级项目,意外发现了一张漂亮而独特的网络拓扑图。它的独特就在于:不仅全面展示了“中国上海”政府网的全局网络拓扑,还自带网络中所有的性能数据,并以颜色预警故障。
看到仲总监眼睛一亮,“中国上海”政府网信息中心张主任很自豪地介绍说,“这是SiteView ECC,主要优势在于系统管理,能自动采集和统计系统性能参数,并通过独特的拓扑图展现”。说到这里,张主任将光标移至拓扑图中一个服务器图标上,立即有一小手提示该服务器的详细性能参数。看到这里,仲总监心里豁然一亮,原来SiteView ECC将所有的统计数据与这张拓扑图做了数据关联,这个产品设计真不错,一目了然地就把握了系统的运行状况。既解决了“系统黑箱”问题,又能故障预警,不也正解决了我长期以来要解决的问题吗?
后来,仲总监又从张主任那里取了不少IT系统管理经。原来,相对于国内外的IT管理软件而言,SiteView ECC的优势不仅在于系统管理,更在于应用管理。它可以监测如Oracle数据库状态和性能、SAP服务器的运行状态、WebSphere系统的运行状况和性能、Exchange服务器的性能以及各应用的端口、DNS服务器的性能和运行状态和IIS服务器的性能和状态等等。
“不知道对于OA系统、ERP系统等这样的应用,SiteView ECC 能否做到监测管理?”尽管很欢欣发现了这样一款适合自己需求的系统管理软件,仲总监还是针对联合汽车电子有限公司的应用提出了自己的一个疑问。
“你来看看我这里的监测主界面,瞧!我们网站的2000多个URL全部都通过SiteView ECC做了页面监测。”张主任笑着说:“作为政府形象工程,保证网站畅通很重要,SiteView ECC会模仿人的操作,检测是否链接正常、网站是否能正常访问等等。同样,它也能一步步检测OA系统、ERP系统等应用是否正常,或者哪个环节出了问题。而且,你不用担心二次开发问题,SiteView ECC提供了开放式的API接口,你尽管开发自己的个性需求。”
信息化升级行动
在真正引进游龙科技SiteView ECC之前,仲总监多次和SiteView上海办事处经理郑一风沟通,双方最后一致敲定如下需求:联合汽车电子有限公司希望通过SiteView ECC及时掌握整个IT系统的运行情况,及时了解网络设备、服务器和存储设备的工作状态,保障各种应用的正常运行,并通过监测性能指标和相关端口、协议、进程进行故障预警。
根据UAES信息中心的IT运维管理需求,郑一风经理为其定制了SiteView V6.2组合解决方案,包括系统管理、网络设备管理和应用拓扑管理。郑一风对该解决方案做了进一步的阐述:“联合汽车电子有限公司尤其关注系统管理,所以我们为他们制定了500个点的监测;而很多设备本身就自带管理软件,因此设备管理监测点数仅设计为100个点;应用拓扑是SiteView ECC的标志性特色,我们每次都会向用户推荐介绍,就像仲总监一样,大家都很喜爱这个功能模块。”
在具体功能实现上,SiteView ECC监测了所有服务器上的CPU、内存和硬盘的使用率,以及AD服务器上的事件日志等;对整个网络的30多台网络设备相关端口状态、流量、丢包率进行全部监控;对于应用系统,主要包括对SAP系统(Oracle数据库的)、Exchange邮件系统、SQL数据库、IIS、DNS、AD、Domino、WebSphere,以及OA、ERP等的监测。
2006年4月,在游龙科技上海办事处的大力配合下,联合汽车电子有限公司的IT运维管理系统顺利通过验收,宣告成功引进SiteView ECC。此时此刻,仲总监终于长长地舒了一口气。信息中心的IT运维工程师们为此欢呼:“再也不用每天多次登陆N台服务器,进行反复枯燥的而必须例行的性能检查工作了。”