二、首先应澄清的概念:“网站群”与“一群网站”
网站群是指统一部署,统一标准,建立在统一技术构架基础之上,信息可以实现基于特定权限共享呈送的“一群网站”。
目前,随着国内电子政务的发展深入,政府门户网站在有效整合各级政务部门的信息资源,加快政府职能转变,起到了重要的作用。许多政府门户网站坚持“为民服务”宗旨,立足“政务公开”和“网上办事”,统一规划,协同建设,分级管理,逐步构建起信息时代的“网上政务门户” 。然而,越来越多的政府门户网站虽然实现了互相链接,但随着网站建设的不断深入,现有网站体系的封闭性往往制约了政府门户网站进一步发展,政府门户网站及厅局等部门子网站基本上是封闭的系统,网站间不能进行有效的信息共享,形成了一个个孤立的“信息孤岛”,即“一群网站”。主要存在的问题有:
1)至上而下的统一的数据规范标准,数据交换大都通过手工方式或第三方系统如FTP、邮件方式等进行。这不但增加了上报人员的工作量,而且经常导致信息报送不及时,造成政府门户网站信息不准确和数据丢失。
2)大量的数据资源处在又希望进行数据共享,又希望有特定的权限体系进行控制的两难境地。
3)多个应用系统间相互独立,没有统一用户管理,导致使用不便,增加管理难度。
4)信息资源组织分类不合理,未建立统一的目录结构体系,造成信息资源利用率低,而且缺乏统一管理。
三、网站群技术实现的基础—大汉版通JCMS内容管理平台
政府网站群的实现是电子政府发展到历史阶段的必然,政府网站资源的综合利用和规范管理的需要。然而,要实现真正意义的网站群体系必须在建设模式和技术手段上达到必要的高度。
在建设模式上,必须建设统一的规范标准体系,建立必要的规范制度。通过分布式信息维护模式和审核机制,做到信息层级管理,资源共享和再利用。
在技术实现上,必须有一个构架网站群的技术平台。这一平台必须以内容管理系统为基础,综合运用和支持信息网格技术、信息环、RSS内容聚合、信息共享和呈送、信息抓取技术、语义网和WEB2.0等。
四、大汉版通JCMS网站群内容管理平台
(一)网站群内容管理平台的功能结构
大汉版通网站群内容管理平台在功能上分为:网站群管理、系统管理、栏目管理(频道设置)、模板管理、模板设置、信息管理、参数设置(系统参数)、媒体管理、发布管理、外挂管理等。系统整体结构如下图所示。
通过信息数据接口,结构化和非结构话数据经导入进入系统,信息存入信息库以前被进行过滤,非法的信息将被清除掉,合法信息被保存到信息库中。信息库中的数据,经过编辑后提交审核,进入审核流程,通过审批的信息以动态和静态的方式发布到网站。误发布的信息可以通过撤稿清除。设计好的模板经过模板接口导入模板库,供发布的栏目选择。模板和信息可以共享给其它网站重复利用。
大汉版通JCMS网站群内容管理平台基于J2EE构架的技术构架,对结构化和非结构化数据资源进行整合管理,提供了一个集数据采集、数据编辑、数据审核和信息发布为一体的网站工作平台。系统集站点管理、用户管理、信息管理与信息发布于一体,通过对栏目、模板、信息的组织和管理,再通过网站发布功能,自动生成网站群体系。
系统支持独立的多站点管理,实现独立域名、独立域管理员、以及独立的采编发数据加工体系,实现网站和网站之间的数据共享和呈送。形成政府和各个部门的信息集成平台的集合,在这个平台上的数据和信息包括各级政府的办事指南、办事流程、表格下载等都来自于政府的各个子站的数据更新和维护,使得多站点资源共享,数据协同维护以及数据集中和分布式部署成为可能。使得政府门户从零散的“一群网站”,整合成具有海量信息和资源的政府“网站群”。
另外,系统在网站的部署上,既可以采用集中式部署,也可以把各级子站部署在各自的服务器上,以适应于各级政府部门的需要。同时,建立的网站群可以实现若干主站和其子站形成的网站集群。
大汉版通JCMS网站群内容管理平台在技术框架上分为:数据层、支撑层、应用层、表现层、访问层、外部公共接口等六大部分。
(1)数据层
对结构化数据和非结构化数据进行调度和存储。结构化数据包括:XML和DBMS。非结构化数据包括:TXT、HTML等文本文件;MP3、AVI、RM、WMV、MPG等音视频文件;DOC、PPT、XLS等Office系列文件;JPG、GIF、BMP、PNG、PSD等图形图像文件;ZIP、PDF、SWF等其他格式文件等,在数据接口上支持WebService模块化组件。同时,数据服务还为其上层提供大量数据操作的应用编程接口API。
(2)支撑层
支撑层通过应用服务器,提供对系统应用层强大的支持,包括:信息抓取、数据转换、检索引擎、统一用户、工作量及访问统计、WAP管理、流程定义以及数据呈送和共享等功能。并通过API、PORTLET、WEBSERVICE、JMS、MQ、DI、URL、DBMS等接口服务支持外部资源对内容管理基础数据以及内容管理对外部数据资源的应用数据集成。
(3)应用层
应用层是内容管理非常重要的组成部分,是对信息处理的重要环节,按功能的不同可以分为:信息发布管理、网站群管理、系统管理、外挂组件管理、单点登陆(SSO)、个性化定制、内容聚合RSS等。
信息发布管理
信息发布平台支持通过浏览器对政府各部门的信息进行分布式管理。其功能包括:信息编辑、栏目管理、数据库自定义、对文档、图片、多媒体数据等的管理,实现数据引用、映射、数据共享呈送、相关、专题管理等。数据基于角色和用户特定权限的安全访问控制,对信息进行所见即所得的编辑,并支持审批、签发和数据预览。同时,可以对网站的模版、样式、单元等进行管理,经过培训的打字人员随时随地可改变网站的显示风格,而不需要依赖专业人员。
网站群管理
系统可以管理和分配网站群,分配每个网站群的域管理员即子站管理员,可以增加和管理各个子站的属性,包括存放目录的管理、站点的DNS管理、以及相关的数据配置属性。各子站管理人员可以进一步分配和管理所管辖网站的各级权限。
系统管理
在系统管理中,系统可以初始化相关属性,完成对网站体系的初始权限部署,包括机构管理、角色管理和用户管理。在权限管理体系上采用多层次矩阵权限管理模式,使得功能、用户、角色、权限实现最为灵活的部署。如:网站信息发布权限、栏目维护权限、信息库管理权限、发布权限、审核权限等;另外对数据字典的维护管理,对多语言版本的管理以及对数据安全的管理都由该模块完成。
外挂组件管理
系统采用外挂组件的统一标准接口完成和其他动态功能模块以及第三方软件系统的接口和数据交互。包括网上投票、问卷调查、留言板、论坛、领导信箱、公告管理、柬言投诉等使用功能,用户可以根据需要进行选择,以丰富网站的功能,吸引更多的访问者。
发布机管理
大型政府网站为提高网站的承载能力和并发,WEB网站是完全生成静态页面的发式,而不是每次访问时都需对数据库的脚本调用。系统采用发布机策略,实现数据可定时按发布队列的多线程远程发布。数据的发布可以人工干预也可以由系统自动完成。系统可以实现对多点的远程WEB服务器的发布。同时,系统可以设定特定端口,并在用特定的私有的压缩算法,对网站的数据流进行压缩、打包、加密,系统基于SOCKET底层通讯,实现高速安全的发布机制。这种机制避免了黑客对WEB服务器FTP的21端口攻击,以及通过IP模拟等手段对数据截获,进而截获密码对整个服务器的控制等。
(4)表现层
网站的最终表现是一组具有相同标准和相同规范体系的网站群体系。它包括政府外网网站群和内网网站群,涵盖政府主站、政府各级子网站、政府垂直机构子网站、各类专题子网站等,同时系统为应用层的不同应用提供信息资源的不同表现形式,包括有:Web、WAP、Portlet、RSS、E-mail、SMS等,
(5)访问层
实现客户通过终端设备(如浏览器、手机、PDA等)来访问表现层以获取信息资源。
(6)外部公共接口
为信息资源的管理层、应用层和表现层提供大量的应用接口,包括:API、Port let、Web Service、JMS、MQ、DBMS、URL等等。
五、 基于内容管理平台的网站群模式, 实现政府信息资源的整合应用
基于大汉版通JCMS网站群内容管理体系建立政府的信息资源整合应用,对于政府信息资源的组织、整理、构架上将起到非常重要的作用,这主要是该平台解决了在网站群模式建设和政府信息资源整合过程中遇到的诸多重要问题:
(一)以政府信息资源为基础构建政府信息资源库体系
统计资料表明,社会公共信息资源的70%都掌控在各级政府职能部门手中,同时政府系统内的共享信息,更是集中存储在上述单位,这是政务信息的源头所在。因此,整合政务信息资源,建设和改造政务数据库,是电子政务建设的关键。
对政府资源实现信息化管理,将有助于打破各级政府和部门对资源的垄断封闭,通过系统有效整合政务信息资源,使政府资源充分服务于社会,从而创造巨大的社会效益和经济效益。
大汉版通JCMS内容管理平台,能够自定义各类政府资源数据库,实现数据自定义多条件查询功能,不需要编程人员或技术人员的前提下实现各类政府数据库的建立,数据的导入导出,并且实现数据之间的同步映射,引用和关联功能,建立起例如:“要闻库”、“法规库”、“宏观经济库”、“企业库”等数据库,对政府的资源进行整合利用这都将成为网站用之不竭的信息宝库。
(二)建立信息交互式传递的通道,实现信息共享呈送和RSS信息聚合
政府门户网站的建设重点是门户内容,门户内容需要所有政府部门的协同共建,协同共建的基础是建立信息交互式传递的通道。政府信息资源的交互式传递分为:基于数据底层的信息共享和呈送技术和基于WEB数据层的RSS信息聚合和信息抓取技术。
信息共享和呈送
交互共享是协同工作的核心,系统支持多级别、横向或纵向的虚拟网站群,并在技术上实现了多网站之间多数据库管理,彻底解决了组织对内、对外、本地与异地、多部门、多网站之间的网络互通、内容整合。加快了信息、内容、知识的积累和流通。系统能够建立分布式构架,即系统程序和数据库可以安装在不同的服务器,主网站和子网站之间以及子站和子站之间可以建立数据共享和数据呈送,即数据的推(Push)和拉(Drag)
数据的呈送共享包括自定义数据库之间的数据呈送和共享,通过该功能可以实现自定义的各类政府信息资源库由各部门网站向政府的报送。
信息抓取
信息收集对政府网站来说工作量巨大,即便由很多人同时去做也无法每天监控上千个以上的网站信息的更新,如果在网站上再抽取感兴趣的内容,甚至对每篇文章进行摘要,再抽取关键字,这样的工作靠人工几乎无法完成。信息抓取系统能准确跟踪和抓取网站上的内容,并识别和分析各个网站的不同结构,准确地提取信息中的几个主要要素(如标题,内容,来源,包括图片等),并能同时去掉与抓取内容无关的如:广告等其它信息,省却需要人工再次筛选、调整的麻烦。信息抓取系统直接监控页面的信息更新,从互联网上实时、自动、准确地获取信息,保存到内容管理系统信息资源库中,共网站信息管理人员审核和编辑利用。
对于异构的网站,往往采用抓取技术,随时获取异构网站的发布信息,通过类聚、去重、Web清洗和关键词自动抽取技术,实现数据的及时同步。
(三)构架统一用户权限,实现单点登陆和域用户管理
在实现门户网站群的建设中,权限的统一管理和统一分配是政府网站群管理的一个重要的组成部分。在一个庞大的网站群结构体系中权限的域管理变得十分重要。由于政府行政上的要求或是政府职能的划分,所有的用户管理不是由一个总的系统管理人员来进行管理和分配权限,而是由系统管理人员管理和分配域管理员,域管理员管理其分配区域的政府部门工作人员的网站管理权限。
另外,政府门户网站群往往是很多政府应用的集中整合,用户管理、身份认证和权限控制在每个应用系统中都占有很重要的地位。但是,各个应用系统使用各自的用户管理体系,会带来使用上的不便、管理上的复杂、资源上的浪费以及安全上的隐患。
大汉版通JCMS网站群内容管理平台底层可选择与LDAP衔接,能够提供统一、集中、有效的基于角色的用户管理、权限管理、资源管理,并且能够提供支持单点登录的用户身份认证服务。
用户权限管理结构图
(四)建立分布式网站构架,实现网站群的集中管理、协同维护、分布式部署的统一。
政府门户网站的集中管理,即所谓的“数据大集中”,有利于资源的整合和统一调配,但是又由于政府职能部门管理的特殊性使得网站必须能够支持独立的管理维护和独立的服务器体系,这就让集中管理和分布部署产生了不可回避的矛盾。为了很好的解决这一矛盾,兼顾政府的职能管理需求,网站群系统必须支持分布式构架。
各子网站可以在远程独立地维护各部门级的网站,并且拥有独立的域名。各部门网站的信息可以互相共享呈送,实现网站群体系内的数据协同维护。
(五)采用智能搜索引擎,实现信息站内搜索与站间搜索相结合
对于大量的互联网信息而言,提供站内信息的全文检索功能是非常有必要的。在网站群建立之后,系统的信息资源将被有机地整合。网间检索即在门户网站群间支持信息的全文检索,同时对于信息的深度加工和信息的再利用成为重要的课题。
大汉版通JCMS内容管理平台包括了智能全文搜索引擎来满足这项需求。搜索引擎提供了普通全文检索及高级检索等多项功能,运行稳定,性能优异。由于搜索引擎和内容管理系统之间有着非常密切的集成关系,所以在使用两个系统的时候可以将信息的查询和网站内容的属性进行关联,大大提高检索的准确率。系统的智能搜索引擎能够搜索多种格式的文件并且采用了Cache等多种先进技术搜索速度快、准确性非常之高。大大方便了网站访问者,有针对性的查找门户网站的各种信息和相关业务。
(六)建立统一的信息标准,实现网站群的RSS内容聚合
RSS(“Rich Site Summary”或“Really Simple Syndication”的首字母缩写)中文称作“简易信息聚合”,是信息聚合的国际标准。是网站站点用来和其他站点之间共享内容的一种简易方式(也叫聚合内容)。利用这一标准系统可以及时获取各网站之间数据的更新状态,并且能够准确第获取网站特定栏目下的信息,实现特定网站之间的数据共享。
网络用户可以在客户端借助于支持RSS的新闻聚合工具软件,在不打开政府网站内容页面的情况下阅读支持RSS标准的网站内容。遵照RSS输出的规范,系统会及时发现网站内容的更新。因此,网站群提供RSS服务支持,能够将网站的内容以更便捷的方式提供给使用者。采用RSS技术,政府门户网站的内容更加丰富,可以方便地聚合来自于相关政府网站的内容。采用了RSS技术,网络用户客户端借助于支持RSS的新闻聚合工具软件,更方便的访问政府门户网站的内容。
(七)政府应用和内容的整合实现内外网一体化,以及逻辑隔离和物理隔离的技术实现
狭义地说,政府门户网站分为内网门户和外网门户两个部分。由于政府网站的涉密性要求不同级别的政府内外网分别采用逻辑隔离和物理隔离的模式。然而,从网站管理和资源整合的角度来讲,外网门户和内网门户本身就是一个有机的整体,甚至外网门户许多内容来源于内网门户。甚至外网是内网的一个子集。因此,在内容管理上必须要求实现“内外网一体化”。
同时,由于隔离等安全性的要求,使得内容管理平台的构架变得十分重要。
内外网物理隔离
针对政府部门要求完全的物理隔离的要求,并考虑到政府部门的实际网络状况,我们必须在内外网隔离的情况下实现网站数据的交换。这就要求大汉版通JCMS网站群内容管理平台必须支持物理介质实现数据摆渡的方法来实现。
系统有内网前置机和外网前置机负责数据的同步搬运、增量管理和导入导出控制。数据通过同步系统的一端进行压缩,然后通过中间物理介质搬运到另一端,最后由另一端的同步系统进行解压和处理(数据库入库和文件复制),并实现数据增量。
(八)支持网站的多样的展现手段,短信、语音、WAP、多语言版本等
政府网站内容的丰富要求更加丰富的展现手段,由于技术发展的要求,网站的展现手段从单一的网页表现新式向多元化发展,政府网站在技术上要求对于短信、语音、WAP等的支持,实现短信告知、听网、手机WAP查询等多种展现手段。
为了实现政府部门信息、通知通告的便捷性查询以及公告便民信息的及时传递,系统能支持移动访问,门户系统平台能够生成WAP网站,内建后台维护模块,能够维护WAP网站的栏目结构和信息发布。支持各类个人数字助理,手机用户的访问。
JCMS平台在动态的生成子网站群的同时也可生成基于WAP访问的WML语言网站,通过WAP网关实现”随时随地”的人机互动。与SMS短信平台不同的是,WAP显示无内容限制,只要移动终端设备许可,WAP内容可无限扩展,WAP与各应用系统捆绑结合,可提供更为全面,更为周到,更加详细的信息。
(九)建立支持国际UNICODE编码的多语言网站群体系
随着我国对外开放,政府对外的窗口也变得非常重要,如何实现多网站群体系对于多语言版本的支持,特别是通过外文操作系统浏览器在调用网站群时能够正常地显示网站内容,这就要求系统能够支持国际UNICODE编码,并且实现对于英语、德语、法语、日语、西班牙语、阿拉伯语的多国语言的信息发布,同时系统内置的全文检索引擎,实现对国际编码的全文检索。
(十)多站点的内容管理,实现信息的协同管理和多点发布相结合
政府网站群体系建立后,各子网站独立地对信息进行维护和更新,同时也支持多网站之间地协同,完成数据的上传下达,同时由于政府信息化的发展往往要求实现多个部门的网站服务器或多个主题的网站服务器分布在不同的物理位置。因此,对于信息的协同管理多点发布成为政府网站群建设的重要功能。
(十一)网站内容和样式分离,使得网站群的改版变得灵活容易
网站的改版是政府网站的重要任务,网站的风格、内容、样式的变化使得网站常变常新。大汉版通JCMS网站群内容管理系统采用内容和样式分离的原则来实现网站的换肤功能。系统提供可视化模板编辑,用户可以利用可视化的页面设计工具,如Dream waver进行页面制作;平台在Dream waver中通过组件代码编辑器插入组件代码,或是通过样式和单元的控制来完成对网站的显示风格的管理。这种所见及所得的方式,可以在瞬间象换套装一样改变网站的布局、外观和风格,而网站的内容继承下来。
(十二)网站群平台信息维护工作量及网站访问统计
政府网站群内容管理平台,内嵌了对信息发布工作量以及稿件采用量的精确统计功能,便于政府网站群中各部门对于信息维护工作量的考核以及分析。同时系统也内置了各个子站的访问统计功能,能够分析每天、每月、每年各子站以及主要栏目的访问情况,并提供报表输出和可视化图形功能。
六、典型案例
中华人民共和国信息产业部
山东省政府
宁波市政府
石家庄市政府
济南市政府