国家图书馆用数字技术传承文明
来源:中国信息化 更新时间:2012-04-14

 

  北京理工大学的学生陈杰经常和同学在国家图书馆翻查资料,在国图的自习室温习功课。但从他升上研究生后,与从前不同的是,他不必再换乘公共汽车,走上几里路,赶到图书馆。他更常做的是坐在桌前,打开电脑,“走进”国家图书馆网站,进行搜索阅读。一切只是从“馆内”被搬到了“网内”。 随着信息和网络技术的飞速发展,Internet成为教育、科研、商业和社会沟通的新模式,人们对信息的加工、存储、查询、利用等有了更高的需求。图书馆的内容已经不仅仅是纸质的图书,它还包括了各种音像制品甚至网络上的各类信息。在信息资源高速传播的今天,有“信息仓库”之称的图书馆,在走过了传统图书馆、自动化图书馆两个阶段后,开始步入数字图书馆建设时期,走向信息共享阶段。

  数字国图 数字庞大

  上世纪80年代末期,美国首先提出了数字

图书馆的概念并正式开始进行数字化图书馆建设。之后,英、法、日、德、意等发达国家以及亚洲的新加坡、韩国也先后提出各自的数字图书馆计划,并纷纷投入巨额资金加以实施推进。中国数字图书馆发展战略组组长徐文伯介绍,进入20世纪后,数字图书馆已成为评价一个国家信息基础设施水平的重要标志,也成为当今世界各国高科技竞争的焦点之一。数字图书馆的出现,引发了一场全球范围内的文化媒介迁移运动,促使许多国家把本国文化遗产大规模转换成数字形态。 不光世界各地的图书馆进行了数字图书馆工程,很多IT公司也挤进这个领域,随着Google推出其网上图书馆工程,各界巨头们纷纷跟进。2005年10月,雅虎宣布加入“开源内容联盟”,并提供后台搜索技术;2005年11月3日,亚马逊宣布正在开发一种新的服务,可以使用户有选择地或者全部地在线购买和阅读图书;2005年11月5日,微软宣布,与英国国家图书馆合作,将其10万册图书数字化。 国家图书馆是全世界最大的中文文献信息收藏基地,同时也是我国最大的外文文献收藏基地。1997年,国家计委批准立项国家重点科技项目“中国试验型数字式图书馆”;1998年,国家图书馆向文化部提出申请,由国家立项实施“中国数字图书馆工程”;2000年,文化部开始在全国倡导实施中国数字图书馆工程;2001年5月,以国家图书馆为组长单位的中国试验型数字式图书馆项目通过鉴定验收。现在,国图已有部分资源库在因特网上提供服务。 据国图数字图书馆管理处主任富平介绍,截至2005年底,国图自建数字资源方面,已经制作完成了20个资源库;全文影像数据共达到10300万页;音频数字化转换43.5万余首,视频数字化转换1.5万余部;网络资源采集设计7个专题,2万多个网站;文津讲坛等讲座近500场,自建资源达120TB。购买了中文数据库32个,外文数据库132个,中文电子出版物2万余件,外文电子出版物1000余件,印象制品11万余件。自建的8个资源库,约610万页已在网上发布,外购的160个中外文数据库全部提供服务。数字国图在2005年的点击率达到了1.8亿次,极大地扩大了信息资源的利用。2006年计划续建资源库12个,新建资源库8个。 国图数字图书馆总工程师孙卫表示,2005年10月开始,数字国图建设最近的一个“五年计划”,但是在2008年时就将正式开馆。

  百年公司,千年图书馆

  美国的数字化图书馆项目由白宫总统的信息基础设施特别工作组和竞争政务会决定放入国家信息基础设施虚拟图书馆中。美国国会图书馆包括了“美国回顾”,提供了美国自1774年至1955间的多类历史、文化、史实性文献;还有“计算机辅助实现虚拟电子图书馆”全面介绍美国国会图书馆、美国国会、政府信息、版权信息、该馆的联机系统、全球电子图书馆系统、研究与发展等各类资源。 孙卫谈到,虽然国家重视数字图书馆的建设,但在与国务院信息办公室相关人员谈话时,他们表示以前只把两类信息作为国家的基础信息,就是商业信息和电子政务信息。其实这是认识的错误,图书馆才应该是一个国家的基础信息,也只有图书馆被法律赋予它保存信息的职责。 “有些做信息化的人对信息化的理解有问题,中国公司少有过百年,但是图书馆里的信息是过千年的。国家对知识型的信息保护不够”,孙卫表示,“对知识保护不够,就是对历史保护不够。只有建好一个国家的图书馆,才能更好地传承这个国家的文明。” 虽然全世界都在做数字图书馆,但是在数字资源的长期保存上却没有很好的解决方法。孙卫表示,人们在使用数字方式浏览信息时,很少想到一盘磁带、一张光盘的寿命最多只有20年,而一张纸的寿命却能达到50年甚至更久。 数据的丢失与存储媒体的变质有很大关系,无论对该数据是来自模拟文件(纸、胶片、录音带等)的转换,还是来自电子文件自身都一样,从而通过技术手段来保存数字图书馆的信息,资源就显得很重要。 数字图书馆信息资源的保存是一项艰巨工作,这项工作的关键在于维护数字信息永久的可存取性,其研究涉及到在多变的数字环境中运行的数字信息,以及怎样合法地控制这种变化并保持数字信息的长期存取。数字图书馆信息资源可存取性的维护要比保护一个媒体的形体艰巨得多,它与法律、经济、文化与技术均息息相关。为保存数字图书馆的信息资源,还需多学科、多部门共同研究与协作,形成一个保护数字信息的社会氛围与技术环境。

  数字国图需要综合型图书馆人

  数字图书馆系统的基础技术是计算机技术,但是数字图书馆系统是一个行业需求背景很强的应用系统,没有行业背景的计算机技术是无法实现数字图书馆系统的。它需要利用专业的图书馆人的编目知识,再使用IT技术手段进行工作。这就要求图书馆中的工作人员具有综合的工作能力。 孙卫表示,“数字图书馆的专业人员、管理人员及其后续储备人才,是建设数字图书馆的关键。数字国图的进一步发展,最缺少的就是综合型图书馆人才”。建设数字图书馆必须确立“以人为本”。传统图书馆时代的工作人员的工作基本模式是人与书的结合,或者说是以书为媒介与读者的结合,也就是人与人的结合。而数字图书馆时代图书馆员工作的基本模式是人与计算机的结合,也就是所谓的“人机结合”,工作人员得通过计算机和计算机通讯网络来获取或提供信息服务。 数字时代图书馆员既要有扎实的传统图书馆学知识,又要兼备计算机技术、网络技术、通讯技术知识,并要通晓

知识产权 (版权)保护和网络安全维护知识,即是通才、复合型的人才。美国报刊曾称:电脑图书馆管理员、对答网络技术人员是21世纪头10年将问世的10种兴起职业中的两种稀缺人才。而在中国由于图书馆数字化起步较晚,计算机在全社会普及率不很高,目前,各类图书馆尚囿于传统的馆藏、借阅工作模式。工作人员中的“两多”和“两少”现象较为普遍:低学历者多,非图书馆专业毕业者多;图书馆学专业者少,懂信息技术者更少。因此,要实施数字化建设,首先要解决人力资源这条“短腿”问题,必须注重对现有人员的信息素质培养,突出图书馆信息技术、网络技术的专业教育,使之紧跟信息化的发展步伐。同时,要花大力气进一批能驾驭计算机开发、运行管理和维护的专业人才,并配备若干名知识产权方面的专业人才,为图书馆的数字化改造、信息化发展和网络化管理作好人力 资源的准备。 中国图书馆工作人员的素质如果不能适应迅速发展的图书馆事业的需求,将严重制约数字图书馆的发展。图书馆人的专业知识、业务能力和自动化、网络化、数字化技术水平,是建设一个成熟的数字图书馆的重要基础。

  版权纷争甚嚣尘上

  “数字图书馆的含义曾被认为是在任何地方、任何时间、任何人都可以查到任何想要的信息,但是那也只能是理想状态”,富平表示,“现实则只能做到在一定地方、一定时间、一定人群可以查到一定的信息。主要原因当然就是版权问题。”

  数字图书馆从其名称来讲,就是把各种信息采集后进行数字化,将图书馆作为最大的集散地,为读者提供虚拟服务,只要读者有信息需求就可以为他提供。

  2005年5月,美国大学出版社协会的主任Peter Givler致信Google,认为Google Print的图书馆计划在很大的程度上侵犯了著作权法,并严重危害了其成员的财政利益。更有一批作家和出版人向Google提出诉讼,指Google造成大规模的侵权行为,结果Google不得已暂停计划。 互联网上的版权问题再次惹得人们议论纷纷。版权问题是所有进行数字资源建设的人都需要面临的问题,在目前却又没有很好的解决办法。

  国图于2005年启动了“文津图书奖”评选活动,每次评出获奖图书十种。“即使是参加评选获奖的书籍,我们也很难全部把他们放到网上,”富平满脸的无奈,“因为版权问题,书籍的作者如果不同意,我们就只能只把书的目录放到网上。”

  不仅是书籍的数字化传播困难,收集网络上的信息也是如此。孙卫提到,中国从1994年有互联网开始,根本没有注意保留网络上传播的信息,现在如果在网上去找当年香港回归的资料,恐怕已经所剩无几了。虽然现在法律还没有赋予图书馆人如何收集网上信息的职责,国图的图书馆人已经开始了收集网上信息的工作,如果等法律出台再去做点什么,网上的信息大多就丢干净了。但是碍于互联网信息传播法的规定,只能一部分为读者服务,剩下的也只能进行最大限度的收存,等法律允许时再放到数字国图上。

  Google的想法是将资讯、知识普及化,他们认为将图书数字化有助销售,因为读者可以很容易搜寻相关的书籍,在阅读之后增加购买意欲,这对作者和读者本是件好事,无论知识的传播还是作者的知名度都从一个国家的地域突升到全球层面。但这却引起部分作者的恐慌,害怕作品在上网之后适得其反,令销量下降减低收入。

  孙卫表示,“数字资源与物理资源是互补的,不可替代的,1997年刚开始做数字资源的时候,以为数字资源的开发上升后,物理资源的利用率会下降,但是当我们把一些馆藏资源放到网上揭示后,物理资源的利用率反而有所上升”。

  站在人类知识的传播方面,免费的资讯分享区是十分宝贵和重要的,版权法的原意是鼓励创作,进而丰富公共领域。从这个角度开始,将书本电子化进行分享是一件有益的事。读者可以轻易地找到自己想看的书,免却了在图书馆的书海里寻觅的痛苦。

  但对于创作者而言,现时创作的生存空间在于书本的版权分账,不单是书籍,音乐、电影、设计等行业都是基于这个模式。所以近几年海关在打击侵权的电影、MP3等不遗余力,因为电影公司、唱片公司、创作人等的利益明显受损,不得不对政府施加压力。2005年香港唱片业和电影业才真正发动反击,筹款准备控告BT下载的使用者。美国早在数年前,好莱坞电影及唱片公司已大力打击小型的软件公司,因为他们开发的软件造成使用者的侵权行为。这些反击就是要保护这个存在了多年的赢利模式。

  作家和出版社的恐惧是来自电影和唱片业没落的这个先例,但问题的关键是书本是否仍然有存在的意义,还是会随数码化而湮没呢?书本电子化是媒体的转变,从纸上跃到荧屏之上,而电影、音乐本来就是要数码化的,所以有着本质的不同。拥有一本书和拥有一个电子档案是两种不同的感觉,书本是慢吞细嚼的,电子档案只限于浅尝辄止,略略看过了,觉得内容适合才会在逛书店时放进购物篮里。害怕是因为担心书本会被电子书取代,如果电子书真的能取代书本,那这将是个大趋势,反而应该思考的是怎样改变书本的销售方式,让作者能从中赚取生活所需。电影公司和唱片公司都没有思考过互联网这个媒体的运行模式,所以很自然地抵抗它所产生的新挑战,用法律和压力去阻止一个必然的趋势,其结果、效果当然不理想。出版界若未能从中汲取教训反而重蹈覆辙便只能空叹息了。

  近年来私人出版越趋容易,伪书问题和书本内容良莠不齐令读者和出版商头痛不已。美国已故文学评论家Northrop Frye曾批评过“在我们的时代,庸俗的文学作品用版权法掩饰,将每一件创作当成是和其他作品有所区别的专利”。富平和孙卫都表示,面对互联网传播权他们显得很无力,他们希望能够在开放与保护之间寻求合适的平衡点,让图书馆人能将更全面的知识呈现给有需求的读者。但是,对于国家法律的进一步完善,孙卫表示只能采取等待的态度,“我曾作过考察,将全国所有的图书馆全部完成数字化建设,全部建成数字图书馆,也不过100个亿的资金,产生的利润太小。我们图书馆在立法界和技术界都没有太强的影响力”。

  目前,国家图书馆及众多国内的数字图书馆为了做到保护知识产权,主要采用浏览和借阅为主,限制打印、传播和永久下载。比如,一次打印不能超过10页, 打印页上加有保护版权的标识。考虑到当前互联网带宽问题,允许读者下载到本地阅读,但下载到本地硬盘的资料是加密资料,只能读者本人在下载机器上阅读,不能传播。下载资料在读书卡过期后自动失效,相当于传统图书馆的借阅和归还,读者对资料不拥有永久所有权。数字图书的阅读量和下载量均有详细统计,作者可以随时查询。所有统计数字和报酬分配方案在中国版权保护中心监督下进行。

  国家图书馆目前做得最多的就是收集和揭示,尽量多的收集各类信息,保证信息的完整,能够最大限度的留存,然后有选择的揭示给读者。属于国图馆藏的文献现在已经全部上网,可以完整地进行查阅。而由于版权问题不能放到网上的,读者又有极大需求的,国图就采取“馆籍互建”或“文献传递”的方式进行服务。