人口信息管理存储系统解决方案
来源:曙光 更新时间:2012-04-15
 山东省荷泽市常住人口达到900多万,算上暂住人口、历史纪录、重点人口以及户籍信息等,数据库记录达到了1700多万条,而且近两百个派出所办公要求数据库系统的性能和稳定性都非常高。为了稳定、高效地管理荷泽市的人口信息,荷泽市公安局迫切需要建设一套能够实现山东荷泽市人口信息集中管理和网络办公的系统。

  山东菏泽公安局户政系统承担菏泽市900万人口的户政管理工作,数据量大,为保证系统能够正常运行,应该达到以下要求:

  用户要求第二代居民身份证系统的后台数据库是一个运行在硬件集群系统之上的并行数据库。在这个数据库中,实现数据录入、查询以及生成统计报表等功能。另外,有第二套并行数据库,数据通过一定的机制复制到这个数据库中。这样,就有两份同样的数据,实现了数据保护的功能。

  Ø 并行数据库系统必须能够实现负载均衡、并行处理,才能应付大数据量下、大用户量的办公业务;

  Ø 并行数据库必须能够实现失效接管。也就是当集群系统中的一个节点或多个节点出现故障,只要还有节点能够正常工作,数据库就仍然能够正常工作。

  Ø 远程备份服务器,这是第二套并行数据库,通过一定的机制将数据复制到这个数据库中(例如,Advanced replication,Stream,DataGuard等),实现数据保护。另外,当第一套并行数据库出现故障,不能正常工作时,马上启用该数据库,为前端提供数据访问服务。

  Ø 同时,该方案应该达到以下用户的要求:

  1.高速、高效率的计算要求

  2.高负载访问负载均衡

  3.满足数据流的大吞吐量和低延时的要求

  4.易升级、可扩展稳定性能强

  5.维护管理轻松简便

  6.合理的总体拥有成本 基于用户需求提出的系统目标

  针对用户的需求,根据我们对该系统的特点和业务特殊性的理解,
服务器机群设计将实现以下目标:

  1) 可靠稳定(故障切换和高可用性)

  数据库系统是整个业务运行的基础平台,必须具有高度的稳定可靠性。这种可靠性既体现在应对大量数据传输、交换,海量数据的存储和妥善保存,更要求随时随地的联通性和连贯性,确保网络系统、应用信息系统的安全、可靠。因此,必须提供一套绝对可靠的系统平台,其可靠性一方面体现在软硬件系统本身的可靠性,如冗余部件和一些系统安全方面的设计等;另一方面,更重要的是,依靠单机最多也只能达到99.9%的可靠性,有时候出现的故障也许并不是因为系统本身造成的,比如电源系统等,或者由于系统的某一部分比如网卡等出现故障时导致了应用系统的中断,如果要求更高的应用系统可用性,就需要利用集群系统通过全冗余方式完全屏蔽单点失效,提供良好的失效平滑接管,甚至可以在无延迟和不丢失数据的情况下接管客户机的访问。

  2) 高性能(负载均衡和并行处理)

  系统的设计和配置应以满足人口信息管理系统的实际业务内容功能的需求为首要目标,在几千万条到上亿条数据记录的实际查询分析操作中,会出现大量的多任务重负载情况,给数据库层造成大的数据吞吐压力,而采用单机不仅不能有效利用系统资源,提升系统效率,甚至会出现多米诺骨牌式的连锁反应,因此,需要应用集群的负载均衡和并行处理技术,将外部发送来的请求均匀分配到集群中的各台服务器上,包括大量用户的并发访问和单用户的重负载运算,这样不仅可以接受更多用户的并发访问,还可以提高响应的速率。

  3) 高扩展性

  信息系统要不断的完善和发展,人口信息管理系统的业务也会随该项目的实施而得到延伸,因此该系统必须考虑到满足一定阶段内业务增长的需求。系统的扩展性不仅需要考虑从纵向到横向的扩展,还要考虑扩展的简易性、灵活性和二次投资的数额,以及扩展之后对整个系统的集中管理。

  4) 高性能价格比

  系统的设计和配置首先应以满足人口信息管理系统工作的实际业务需求为首要目标,力求面向实际、兼顾未来,达到最佳的性能价格比,而在这一方面,不仅需要考虑一次性软硬件成本的投入,还需考虑最终用户系统维护方面技术和资源的投入,主机服务和售后的投入以及投资的时效性。

  

  基于64位四路服务器和4000A机群的解决之道

  根据用户需求和系统目标,曙光认为既要遵循实际原则,从实际应用出发,遵照实际情况确定本方案的选择与实施,确保安全用户的安全,也要遵循先进原则,利用先进的计算机技术来建设计算平台和系统,保持系统的先进性。同时,还要采用广泛应用且性价比好的产品,既节省投资,又保证设备的先进性。

  在这一原则的指导下,曙光向用户推荐使用曙光4000A机群及四路64位R4380A及2路64位R220A等64位技术来构建山东菏泽公安局的人口信息管理系统。 曙光公司根据用户的需求,推出基于Cluster集群技术的双机备份解决方案,包括用于对双服务器实行监控的容错软件和作为数据存储设备的系列磁盘阵列柜。通过软硬件两部分的紧密配合,提供给客户一套具有单点故障容错能力,且性价比优越的用户应用系统运行平台。

  本次采购的网络服务器担负着关键性工作,对服务器的稳定性、高可用性、数据的安全性提出了非常高的要求。据此,我们从过去所完成的大量解决方案中吸取经验并结合新的技术提出了双机容错解决方案,提供了包括磁盘柜系统,双机双控软件结合的高可用性完整解决方案。该方案面向企业用户, 可以根据企业应用的发展规模,进行可伸缩的调整,以保证用户的投资。

  

  机柜子系统

  曙光4000A机柜采用曙光机群专用机柜,机柜中内置了导轨、托架、钩刺等设备,能够将不同厂家、不同高度的19”标准设备准确内置其中,机柜中具有良好的布线设计,能够规范以太网、电源等走线以及机柜之间的布线。机柜子系统分为主机柜和扩展机柜两种,主机柜中放置机群电源系统、主干交换机、内置控制台、机群监控系统等设备、I/O节点、登录节点等设备,必要时也可以放置计算节点;扩展机柜中放置计算节点、管理交换机(1000M)等设备。曙光4000A大规模机群系统采用机柜组的方式,每个机柜组最大包含128个节点系统、一套监控系统,一路三相380电源输入和相应的网络系统,具有一个主机柜和若干个扩展机柜。

  

  硬件监控子系统

  曙光4000A机群提供了基于曙光公司I2C独立硬件网络的大规模机群的硬件监控系统,结合曙光公司的节点机监控系统,可以对机群进行多重监控,保证机群的稳定运行和简单管理。这套监控系统既可以基于触摸屏,也可以通过网络基于远程显示器,是目前机群系统中最先进的硬件监控系统

  

  管理控制系统

  曙光机群提供了目前业界最先进的大规模机群SKVM视频切换系统,能够既经济又美观的解决超大规模机群(1024节点)的视频切换。曙光SKVM系统既能够支持多用户切换,也可以支持远程切换,是大规模系统管理员的有力工具。曙光的SKVM可以可扩展到1024个结点以上,并将KVM设计成级连的方式,以满足大、中、小机房的不同需求。大规模SKVM系统包括节点(Node)、终端(Terminal)三种设备,设备之间采用五类双绞线连接,组成SKVM网络。

  

  电源子系统

  曙光4000A电源系统是曙光为机群系统设计的专用电源系统,包含了电源检测模块、电源监控模块、负载均衡设计、单片机分时上电设计以及独特的端子排设计,能够支持220V双相电和380V三相交流电,整个机群电源系统的设计符合航空标准。

  

  机群监控软件DCMM

  曙光公司根据其10年的高性能计算机研发经验积累所得的软件产品机群软件是曙光机群的最宝贵财富,这些软件经过了10年100多种应用几千个用户的测试与使用,成熟稳定,是机群系统不可缺少的连接单机操作系统与用户应用的核心软件层。

  曙光机群监控软件DCMM与监控硬件配合构成了曙光机群监控系统,DCMM具有以下的几个特点:能够跨操作系统平台和硬件平台采集系统信息,能够从2个节点的监控一直到1024个节点,信息采集面比较广泛,包括系统信息、硬件信息和电源信息,具有良好的报警设计,当监控的指标超过一定的范围时,DCMM能够通过用户设置的手段向用户报警,包括MAIL、鸣叫、日志等等方式。