校园数字图书馆构建策略研究
来源:科技情报开发与经济 更新时间:2012-04-15

作者:周秀英

摘 要:分析了我国数字图书馆的发展现状,提出了校园数字图书馆的构建策略,包括数字图书馆硬件平台的建设、数字图书馆软件平台建设以及数字图书馆人才队伍的建设,结合当前XML技术的发展,展望了数字图书馆的发展趋势。   关键词:数字图书馆;硬件平台;软件平台;XML技术   中图分类号:G250.76文献标识码:A

1 数字图书馆发展现状  

数字图书馆是当前计算机技术和信息技术在图书馆信息化实践中的体现。数字图书馆建设已成为国际高科技竞争中新的制高点,成为评价一个国家信息基础设施水平的重要标志。随着信息网络技术的发展,我国图书馆初步走上了数字化之路,取得了令人瞩目的成就,出现了一系列的数字图书馆项目或图书馆数字试验计划,如:“中国国家试验数字图书馆”计划、清华大学图书馆的“数字图书馆研究计划”、上海图书馆的“数字图书馆试验项目”和广东省中山图书馆的“广东新世纪电子图书馆计划”等。  

目前,数字图书馆的建设可以分为3个阶段:校园图书馆的业务自动化管理建设、校园图书馆的数字化建设、联合图书馆的数字化建设。   随着信息化技术的发展,一般学校早已经完成了图书馆的业务自动化管理建设。所以,目前最重要的是进入校园图书馆的数字化建设阶段,至于联合图书馆的数字化建设阶段涉及到数字图书馆的标准化问题,故还没有成熟。以下主要对校园图书馆的数字化建设阶段进行研究。  

2 校园数字图书馆构建策略   校园图书馆数字化建设主要包括信息化基础平台建设、信息数字化、存储以及容灾、信息检索等方面的建设。其中,可以划分为3个主要的方面:一是数字图书馆硬件平台的建设;二是数字图书馆软件平台建设;三是数字图书馆人才队伍的建设。  

2.1 数字图书馆硬件平台建设  

IT基础平台是指支持客户应用运行的基础环境,包括硬件(服务器、存储设备、网络)、系统软件、管理软件方面的建设,这是信息化的前提。其中,硬件设备的购置应该遵循四位一体的选型原则:即安全性、技术先进性、成熟性和兼容性。   基础网络建设:在考虑当前需求的同时,还要充分考虑到将来扩展的需要。系统平台、网络协议、网络技术及网管标准都应遵循国际标准化。一般馆内主干采用快速以太网即可,1 000 Mb交换机对于馆内来说比较适合。其网络拓扑结构见图1。  

网络环境:数字图书馆本质上是基于网络环境下的海量数据库及其应用。网络操作系统应为当前的主流网络操作系统,如Windows NT/2000/2003,Unix或Linux等。网络环境以Internet为基础进行设计,要能够支持多种网络协议。   服务器:其选购必须是面向海量处理的服务器,在海量计算、海量通信、海量存储和海量通道上可构筑一个全新的计算平台。故主频、系统的SCSI控制器的传输频率、数据频宽、传输率等参数必须作为重要参考,使得处理速度、数据吞吐量必须能完全满足并发多用户对数字图书馆中数据加工、检索、阅读等方面的要求,并使其支持硬盘、网卡、电源等的热插拔功能,从而有效提升系统工作的可靠性和稳定性。  

 存储设备:光盘、文件服务器、磁盘阵列为数字图书馆常见的存储设备,并且数据的灾难备份及恢复也是要考虑的一个重要因素。  

交换机:一般馆内主干采用快速以太网即可,1 000 Mb交换机对于馆内来说比较适合。考虑到经济实力及现实需求,主交换机可采用Cisco,3Com和Intel等著名品牌,其他都采用国产性价比较好且实用的交换机,如联想D-link,Accton,Zonet,实达,TP-Link等。   2.2 数字图书馆软件平台建设   数字图书馆软件平台主要由数字图书馆发布系统、数字图书馆管理系统以及数字图书馆全文检索系统组成。其中,数字图书馆发布系统主要进行如下工作:数字信息资源的获取以及整理→格式转换→元数据标引→目录制作→分类→链接制作→检查→发布;数字图书馆管理系统主要进行用户管理、图书管理以及系统管理的工作;数字图书馆全文检索系统提供模糊检索、精确检索、二次检索、关键词检索、全文检索等检索功能。数字图书馆系统架构见图2。  

制作数字图书馆发布系统,以下3方面是最重要的。  

2.2.1 数字信息资源的获取  

(1)录入方式:这种方式速度慢,错误多,需要大量人力、物力。  

(2)扫描方式:涉及到信息转换技术、信息识别技术、信息压缩技术、信息储存技术、信息保护技术等主要技术。为实现高速扫描,高速扫描仪选购时要注意其扫描速度、识别通过率、错误、卡纸及失败率等技术指标。  

(3)直接购买数字资源。  

2.2.2 数字信息资源海量数据的存储和管理  

数字图书馆系统必须具备海量存储的能力,有足够的输出能力,能快捷地进行资料整理,以及能提供检索功能。目前,数字图书馆信息资源保存的主要方式如下:   光盘:采用配备了机械手臂的光盘塔和光盘库作存储设备是一种比较广泛的数字信息存储方案。其优点是价格低,但读取速度慢且光盘容易划伤磨损。   文件服务器:文件服务器也是存储数字信息的主要方式,其特点是响应速度快,网络数据传输量大,但成本高。目前Internet上网站的信息大多都是以这种方式存储。   磁盘阵列:磁盘阵列主要用于大容量、高要求环境下的重要数据备份,其传输速度更快、容量更大而且能自动容错,但成本昂贵。  

从存储技术的发展来看,必然向更高速、更大容量及更低价格发展。因此,可以将光盘与磁盘阵列结合,以此来满足大容量实时数据应用的需求。   数据保护——服务器容错技术:   磁盘镜像技术:海量存储能力固然重要,然而数据的备份、容错也不容忽视,可以通过磁盘镜像技术来支持。其简单工作原理就是把相同的数据备份存放在两个驱动器,当一个驱动器出现故障,另一个仍然可以维持系统的正常运转。故障恢复时只要把数据完好的备份拷贝到正常的驱动器上就可以了,以数据冗余来换取数据的安全。   双机热备(Hot Standby):该方案是由两台服务器系统和一个外接共享磁盘阵列柜(也可没有,而是在各自的服务器中采取RAID卡)及相应的双机热备份软件组成。在这个容错方案中,操作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。双机热备是计算机应用系统稳定、可靠、有效、持续运行的重要保证。它通过系统冗余的方法解决计算机应用系统的可靠性问题,并具有安装维护简单、稳定可靠、监测直观等优点。  

2.2.3 数字信息资源共享(发布)  

发布系统是将信息数字化后的数据发布到数字图书馆系统之中,以供用户和读者使用。其涉及到从海量信息存储到面向对象的分布式管理,从模式识别、基于知识内容的数据挖掘和检索到人机界面技术等等。   体系结构:当前软件体系结构上以C/S结构、B/S结构或三层架构为主。在数字图书馆软件体系架构上应选择B/S结构或三层结构。  

检索系统:OPAC(Online Public Access Catalogue,在图书馆学上被理解为公共电子书目)提供了读者信息查询、书刊目录查询、网上信息发布、最新书刊查询等网络化的业务服务。数字图书馆的真实含义是数字资料库,其中全文检索系统最为关键。目前,应用XML的数据检索技术,结合DHTML,DOM,DSO等技术的Web查询方案能够获得较佳的系统查询性能。并且XML的自我描述特性能够很好地表现许多复杂的数据关系,使得基于XML的应用程序可以在XML文件中准确高效地搜索相关的数据内容,能实现优化二次检索。这些技术的发展完善了数字图书馆的全文检索系统,使读者能方便地进行基于内容的全文检索和基于作者、标题、摘要、分类的检索和模糊查询。  

2.3 数字图书馆人才队伍的建设  

传统图书馆馆员的角色只是知识的保存者和管理者,其借书、阅览、参考咨询等服务是以馆藏印刷性资料为基础的,服务主要依靠手工来完成——手工编目、人工标引、卡片目录、装订、上架、排架及校点图书等等,只是进行简单的图书资料的分类存放、借阅催还工作,似乎谁都可以胜任。  

然而,数字图书馆的出现给传统图书馆带来了巨大冲击,主要表现在信息存储、处理、检索、传递、管理等方式将发生根本变化。数字图书馆建设需要高水平的计算机技术、网络技术、数字化技术等专业人才,这要求数字图书馆馆员应该是一个高素质、高技能的复合型人才,其肩负着设备的采购、系统的维护、读者服务的提供等任务。因此,需要对现有馆员进行必要的全员培训,以及引进相应的人才,形成一支优秀的数字图书馆人才队伍,才能保证数字图书馆的建设、维护和管理。正如美国学者认为,今后的图书馆馆员将逐渐成为网络信息导航专家和信息咨询专家,图书馆馆员的角色将逐步朝这一方向转变。  

3 数字图书馆发展趋势   数字图书馆建设并不是某一个或某几个图书馆的事情,它涉及整个文献信息领域。建设数字图书馆的主要目的在于实现全社会对文献信息资源的共享,将各个图书馆的资源通过信息网络集成在一起,形成一个临时性的开放组织,对外部资源进行整合,达到最大限度、最充分地利用资源,即数字图书馆建设的第三阶段——联合图书馆的数字化建设,这正是建设数字图书馆的意义所在。   要实现资源共建共享,需要遵循统一的标准或规范。目前,我国图书馆信息化建设标准与规范还没有完善,各个图书馆之间及各图书馆与其他单位的信息交换中普遍存在着异构现象和异质现象。随着XML作为在Web上交换数据的一种标准方式的出现,面向Web的数据交换、数据挖掘将会变得非常轻松。今后,需要摸索建立一套行之有效的工作流程和标准规范——在信息标准交换技术、信息格式转换技术、信息集成技术以及互工作技术、互操作技术等方面制定统一标准,最终实现全社会对文献信息资源的共享。  

4 结语   数字图书馆的建设应该分阶段有序地进行,在现阶段主要完成校园图书馆的数字化建设,从硬件系统、软件系统、人才队伍的建设这三方面同时进行。在此基础上,最终实现联合图书馆的数字化建设,真正实现广泛意义上的全社会文献信息资源共享利用。随着数字图书馆的建设,其数字化技术必将延伸至“数字城市、数字政府、数字教育、数字文化”等各个领域,并应用于各行各业,不断改变人们的学习、工作、生活和思维方式。

参考文献   [1] 束漫.广东数字图书馆建设的状况、问题与建议[J].图书馆论坛,2004(1):73-75.   [2] 刘浩.柳州市图书馆数字化建设技术研究与探讨[J].广西工学院学报,2003(1):40-43.   [3] 欧阳美林.广东省高校电子图书馆的初步实践[J].图书馆建设,2003(4):96-98.   [4] 胡俊荣.论图书馆国际化[J].中国图书馆学报,2003(3):25-28.第一作者简介:周秀英,女,1978年6月生,现为中山大学计算机软件与理论专业2003级硕士研究生,助教,广州城市职业学院计算机工程系,广东省广州市广园中路248号,510405