浅析电子政务外网数据中心IT设施规划设计
来源:天极网 更新时间:2012-04-14

  作者:秦静 

  电子政务网作为国家各级政府信息发布的门户,在国家经济建设中起着重要的推动作用。贵阳市电子政务外网是国家电子政务外网在我市的延伸,是我市电子政务重要的网络基础设施。到2010年底,将实现上联省级电子政务外网,横向连接市级各局、委、办单位,建设和完善市级数据中心、网控中心和服务支持中心,构建全省统一的安全保障体系,实现跨部门、跨地区的信息资源共享,为各部门业务承载提供基础网络支撑环境,促进业务系统的互联互通和信息共享,提高政府的监管能力、服务质量与政务信息化水平。因此如何对电子政务外网数据中心IT设施做到有效的管理、保证系统安全稳定的运行,达到管理简单、运行高效、操作安全、稳定可靠成为我们的建设目标。

  目前 贵阳市电子政务网的推行情况优于全省其他地区,但由于建设时间较早,经验不足,缺乏统一规划,数据中心机房内服务器管理凌乱,运行效率低,能耗大,致使运维人员管理强度增加,管理效率低,很难满足国家电子政务的相关规范与要求。因此为了满足电子政务的发展要求和应用要求,改变目前数据机房的管理模式,我们根据贵阳市电子政务提出的“一个平台、三个中心、整合四个应用”建设目标,进行了数据中心IT设施综合运营管理的规划设计和实施。

   一个平台:即依托电子商务传输骨干网,建立全市统一的电子政务网络平台

   三个中心:即建立网控中心、数据中心和网络服务中心

   四个应用:即政务服务中心、综合治税、城市综合视频监控平台、门户网站体系

  围绕这个建设目标我们必须完成网络化和集中化的转变,需要在基础网络和数据中心建设方面不断加大投入,从基础建设来讲各种应用于电子政务的解决方案都比较成熟,而且也有很多其他地区的优秀成果值得我们借鉴。目前摆在我们面前最大的困难是如何在有限的人力资源情况下管理好大量增加的网络设备和服务器等IT基础设施,矛盾主要集中在数据中心IT管理方面。

  目前数据中心常规的IT基础设施运维管理主要有网内管理、带外管理(KVM)、还有一些专用客户端工具来对其设备进行管理。管理工具丰富,操作过程简单方便,但在规模化应用上就明显不足了。比如Telnet、RDP等网内的远程维护工具,以其小巧和方便的特性在网内运维过程中的使用相当普遍,但这类工具在大规模的IT设施管理中存在很大的局限性和安全隐患;在传统的数据中心IT运维管理过程中,对IT设施运维的集中综合管理考虑的比较少,但数据中心在电子政务外网的建设规划过程中面临着数据量急速膨胀、服务器利用率低、能耗大、场地不足、IT运维管理成本高昂等一系列挑战,IT设施的运维管理不仅仅要考虑IT设施的单点接入管理,而需要考虑在大规模设备基础上的集中管控,同时考虑集中管控过程中的安全内控问题,主要包括了:系统运行安全、电子信息资产安全、运维操作过程安全等几个方面,传统的IT设施运维管理手段无法满足以上的安全审计需求;同时IT设施的大规模增长带来了大量的能源消耗,作为现代IT设施运维管理的重要部分,如何将能耗管理切实实施,积极响应国家的节能减排、绿色管理的号召,亦是在电子政务外网建设中需要考虑的一个问题。

  根据贵阳市电子政务网的实际状况和未来发展的需要,对数据中心IT设施运营管理采用了深入调研、全面分析、统一规划、分步实施的方式,在面向数据中心的IT设施运营管理技术基础上,我们提出了电子政务网的数据中心IT基础设施管理进行规划的“一站式”的规划设计理念。

  规划中通过德讯DCLive运营综合管理平台实现了整合、安全、能耗三个主要方向的诉求,在系统整合方面分为两个层次的整合,第一个层次实现运维手段的整合,对所有运维应用及运维方式进行整合,另外提供一个平台化管理工具,实现各种IT设施运维管理的整合,包括网内运维、带外运维、安全审计和能耗管理等方面的内容,通过整合的措施来实现全方位的集中管理,对IT运维管理过程达到4A(认证Authentication、账号Account、授权Authorization、审计Audit)统一的安全管理模式,在简化管理的同时减少安全隐患的目标;

  在网内运维管理方面的从提升IT设施管理能力、提供操作过程安全的角度出发。通过运维网关,以“运维跳板机”的方式,实现网内访问途径的统一扎口,强制所有运维操作全部通过运维网关进行;在运维网管中实行严格的权限划分,每个IT运维人员只允许查看到与自己有关的设备,而且每个设备有哪些可以操作的动作全部可以在设备上展现,通过这样的方式来提高人员的运维管理工作效率和过程安全控制管理;

  在带外管理方面提高管理设备的普及程度,以提高异常情况的应急处理能力,一旦在网内遇到异常情况下无法正常进行管理时,可以通过带外的方式来进行运维,保证运维管理的持续性,并远程的“本地化”运维,实现远程无障碍的IT设施管理;另外在带外管理中增加安全特性,即连接会话的审计功能和会话内容审计功能。

  安全管理方面也在两个方向上进行了全面规划,第一、增加访问控制策略,通过权限与策略管理的配合来保证合法用户权限内的受控访问,使每个IT运维人员操作范围明确、操作内容明确、各司其职,各自有序的管理自己所辖的IT基础设施;第二、对带外管理(KVM管理和串口管理)和网内运维管理实现全生命周期的审计,亦即从操作人员登录运维平台开始到运维人员登入相应设备或在运维平台的所有操作,直至操作人员登出运维平台,全程进行流媒体的操作录像,审计过程将在符合5W1H(When/Where/Who/What/Why/How)原则的情况下还要具备历史操作的还原能力,即完全再现历史操作场景,保证问题追溯的方便性和不可抵赖性;

  在能耗管理方面最大的问题是不可知性导致的,所以只能靠自身经验和第三方的建议来进行改进,对于是否完全符合我们的需求很难量化,而从国外与国内的数据中心的PUE(电源使用效率)比较来看,我们国内的数据中心的平均值在3.0以上,比国外的足足高出了三倍,也就是说我们数据中心能耗管理方面还有相当大的提升空间,因此我们在能耗管理方面首先做的是精确采集和计量,对象主要是电力消耗情况和环境数据尤其是微环境数据的采集,通过采集和计量的量化分析作为改进和调整的依据;另外就是联动控制,比如检测数据中心内每一个机柜内的温度情况,某些机柜常态的温度过高,是不是可以考虑增加出风口数量,对于温度不高的地区是否可以考虑关闭出风口或降低出风量;对已有些云计算的机器设备来进行支撑的系统在没有压力的晚间可以考虑自动的关闭服务器的运行;最终通过各种量化的手段来实现降低PUE指标,达到使数据中心变绿的管理目标。

浅析电子政务外网数据中心IT设施规划设计


  示意图:德讯DCLive“一站式”IT实施运营管理平台规划案示意图

  目前在我市的电子政务外网数据中心IT设施运营管理规划实施中,将带外管理、能耗管理、网内管理和安全审计基于一身。实现了IT设施运维与安全审计的结合,精确的量化采集、监测与设备联动控制的结合形成了既独立又统一的整体,很好的解决我们在数据中心IT运维管理中的困难和瓶颈。规划本身也是针对于我们数据中心的IT设施运营管理的问题而形成的,它重点解决了管理、数据收集、安全几个方面的问题,也是为我们后期数据中心未来建设的IT业务管理来奠定基础,提供强有力的数据收集支撑和快捷的运维操作支撑,已满足IT业务管理的配置管理、变更管理、问题管理、安全管理等要求。