政务信息查找中“鱼”和“水”的辩证法
政府的电子政务建设已经走过10几个年头,各级政府内部也都大大小小的建立了很多信息系统,在提高服务能力和决策水平方面起到了不可忽视的作用。然而,随着信息量和信息系统的增多,大家发现在信息查询上花的时间越来越多,信息系统的数量并不和信息获取效率成正比。据IDC不完全统计,普通政府公务员平均每周花费在内部系统信息查找的时间为10.5小时,其中无效查找浪费6.4小时,也就是说,公务员的10次信息查找中只有4次可以获得所需要的信息。而究其深层次原因主要有两点:
第一,信息和信息系统的不断增加,使得信息量、信息系统和信息使用者需求之间的矛盾愈发突出。
如果我们把信息和信息系统比作海,有效信息比作鱼,那么我们可以这样去形容政府工作人员信息查找工作的变化:原来在湖里捕鱼,现在是在海里捕鱼了。水面越大、水越深捕到自己想要的鱼就越困难,这就是资源。多个信息系统和使用者个性化需求之间的矛盾,信息量越大,信息系统越多,使用者越发感到无所适从,个性化需求越难满足。
第二,海量数据环境下信息的关联性增强,获取全面、深度信息的需求越来
越迫切。
信息量大了,信息之间的关联性增强了,获取深度和全面信息的需求也就越
来越迫切了,好比原来我们只需要捕浅水的鱼,而现在需要捕深海的鱼了。可是目前的系统还远远不能够满足我们的需求,我们想获得全面、精准的信息,必须输入N多个名称和密码,分别进入不同的系统查找,然后手工简单合并在一起,繁琐且复杂。另外,由于原有的OA、公文、文档管理等系统多不提供信息挖掘的手段,那么信息质量的好坏只有依赖查找人的个人素质。
因此,如何解决信息量、信息系统和信息使用者需求之间的矛盾?如何在海量环境中发现有价值的政务信息资源?就成为了各级政府信息部门一直最为关心的问题,也是电子政务建设中重点研究的课题。
据笔者了解,现今很多政府信息部门正谋划通过建设统一、便捷的信息搜索系统来解决以上问题,而前不久,国家环保总局刚刚上线的内部电子政务综合平台搜索系统便是典型代表。
国家环保总局搜索系统——搜索引擎应用模式向组织内部延伸
国家环保总局搜索系统,采用搜索引擎的机制,通过“监控”和“抓取”各个内部信息系统中原有的信息资源,建立集中的信息资源库和有效专业的索引机制,实现统一地跨库资源检索,为内部工作人员提供统一、便捷的内部信息搜索服务。
像搜索互联网信息一样搜索内部信息
国家环保总局搜索系统的应用方式和互联网搜索引擎很相像,如:提供一个简单的搜索框,输入关键词,就可以对收文、发文、办公文档、督察信息等多个数据源进行统一检索;提供类似于“网页快照”的“文本快照”,单击某条信息文本快照则会显示WORD、PDF、WPS等文档中的文本信息;提供高级搜索功能;提供检索词提示等等。
国家环保总局信息部门负责人员这样描述该搜索系统的应用效果:“国家环保总局搜索系统是互联网搜索引擎应用模式向组织内部的延伸,用户在组织内部的搜索环境中,通过熟悉的操作界面和操作方式,获得了统一、便捷的搜索体验,符合用户固有的使用习惯,有利提升了单位领导和工作人员利用信息资源的水平。
N次检索“变”一次检索
国家环保总局搜索系统的建设,解决了内部人员迫切需求的统一检索问题。从前查询同一主题的内容,需要分别登录各个系统检索一次,然后将结果手工合并,繁琐且复杂。
而搜索系统建立后只需检索一次,且提供自然语言机制,保证更好的查全和查准,如:同义词扩展检索,结果根据关键词相关度进行排序,把最相关的结果排在最前面等等。
突破了原有Notes、Exchange系统的瓶颈
目前大部分政府机构采用Notes、Exchange等系统进行办公和文档管理,虽然Notes、Exchange在工作流、协作方面有强大的优势,但是在检索功能方面却存在瓶颈,主要表现在:不支持RTF、OFFICE、WPS等文档内容的检索;索引更新效率低,输入信息后不能够马上检索到;不支持数字和文本混合搜索方式,随着信息量的增长,检索效率大幅降低等等。
国家环保总局搜索系统后台采用专业的索引机制,有效解决了上述问题,突破了原有Notes、Exchange系统的瓶颈。
继承原有系统对信息的安全控制
统一搜索服务的建设没有破坏原有各个系统的权限,搜索系统用户和原有各个系统权限保持一致,继承原有系统权限,没有权限的检索不到,有权限的可以检索到。
此搜索非彼搜索——国家环保总局搜索系统的四特性
虽然从应用方式和应用体验上来看,国家环保总局搜索系统和互联网搜索引擎极为相似,但是两者在搜索范围、搜索对象以及应用特点等方面有着本质的区别。国家环保总局搜索系统是典型的企业搜索引擎应用,有企业搜索的特质,本系统的技术提供商北京拓尔思(TRS)信息技术有限公司企业搜索产品研发人员,从以下四个方面阐释了国家环保总局搜索系统的企业级特性。
数据结构的复杂化
首先是数据结构的不同。互联网上的数据组织形式都是基于 HTML组成的网页,而国家环保总局搜索系统包括互联网信息,更多的是各种电子文件格式的非结构化及半结构化数据。1997至今,环保总局办公和信息系统中已经积累了大量的文档数据,且经过几次版本升级。为了适应不同阶段的机关办公需要,数据库存放有不同阶段的主要文档类型,如RTF大文本、Word文档、WPS文档、扫描后上传的图片等,这些数据都是国家环保总局搜索系统抓取和索引的对象。
搜索的精准度更高
相对于互联网搜索,国家环保总局有很多专业性很强的信息,对查全率和查准率有着非常高的要求,如:公文搜索等,目前系统既可以对公文信息进行全文搜索,又可以对发文日期、拟稿人等属性信息进行搜索,实现了结构化数据和非结构化数据的联合搜索,并提供基于内容的相关度排序,保证公文搜索的精准度。
实时性更高的搜索
一篇新的信息发布后,往往3-7天后搜索引擎才能检索到,国家环保总局搜索系统作为面向业务的搜索系统,必须能够动态反映实际情况,索引系统后台采用即时索引策略,用户要求录入的文档应该马上就能够被检索到,满足搜索面向业务的需要。
安全的搜索
和面向大众的互联网搜索不同,国家环保总局搜索系统的安全性是无法回避的,国家环保总局搜索系统通过继承原有系统的权限,保证了搜索的安全性。
从国家环保总局搜索系统谈开去—搜索是一种创新的资源整合策略
从本质来看,国家环保总局搜索系统是一个资源整合系统,“搜索”是其核心支撑。通过整合有效解决了“多个信息系统”和“统一检索入口”的矛盾,使得信息的全面性和精准度得到很大程度的提高。回顾我们近几年的政府信息化工作,虽然资源整合已经是一个老生常谈的问题,然而在实际系统的建设中,资源整合系统的效果并不如人意,这主要体现在:
第一,资源整合系统的建设对原有系统的破坏性太大,本世纪初政府建立起来的信息系统的开放性、扩展性都不够,资源整合系统的建设往往就是对原有系统的重新开发和部署,投资大,周期长,破坏了原有系统的投资。
第二,部门之间条块分割,由于安全因素等原因很难纳入到一个平台体系下面,使得资源整合系统的建设漫漫无期,成为空谈。
国家环保总局搜索系统的建设给了我们很大的启示,“搜索”作为一种被动获取系统信息的方式,可以有效解决以上的问题。首先,对原有系统没有任何影响,原有系统不需要搜索系统的建设而做任何的改动。其次,通过继承原有系统的安全性,可以有效整合多部门的异构资源。同时,我们也应该看到,互联网搜索引擎已经被越来越多的人所使用,搜索的应用方式和体验已经渐渐成为用户的固有习惯,以搜索方式出现的资源整合系统更易被大家使用和接受。
综上所述,企业级搜索是目前环境下比较适用的资源整合“策略”,它必将在以后的电子政务建设中发挥举足轻重的作用。