作者:贾玉萍
摘 要:分析了网络时代信息用户的需求和信息服务的特点,重点介绍了网络环境下学术信息交流开放存取机制的产生发展过程及其实现方式。
关键词:用户需求;学术信息;开放存取
中图分类号:G252文献标识码:A
1 网络时代信息服务的特点
1.1 用户信息需求特点
(1)信息需求广泛化和社会化。网络为用户打开了认识世界、共享信息的窗口,使网络环境中信息交流日益频繁,极大地满足了人们交流、获取、共享信息的需求。随着用户社会交往范围的扩大,信息意识的日益增强,社会中每一位成员都将是信息和知识的需求者。用户信息需求广泛化和社会化,客观上提出了信息资源社会化共享的问题。
(2)信息需求多元化和多层次化。网络环境下,随着人们信息需求意识的不断增强,人们可以跨时空进行各类信息的消费,从而呈现出多元化的特点。同时,由于用户职业、专业不同,受教育程度不同决定了他们对信息需求的层次不同。
(3)信息需求数字化和网络化。随着全球信息化和网络化发展,传统的信息获取方式已远远不能满足人们信息需求飞速增长的需求。据美国互联网调查公司eTForecasts于2002年12月15日的统计,全世界互联网用户数量已达6.65亿个,比2001年增长1.1亿个。其中,美国1.6亿个,日本6 400万个,中国5 400万个。越来越多的用户已经或正在成为网络信息服务的利用者。 (4)信息需求的集成化。网络的普及极大地推动了社会信息化的发展进程,使得信息更新周期大大缩短,社会信息总量急剧增加。
1.2 网络信息服务的特点
(1)网络导航。建立专业化的导航系统,通过“学科馆员”对网上相应的学科专题资源进行识别、筛选、过滤、控制、描述、评价并组成目录信息或提供原站点地址供专业用户选择。
(2)智能代理。它是一种可配置软件,用来完成用户信息资源检索和分类工作。智能代理根据用户事先定义的信息检索要求,在网络上实施监视信息源,如指定Web页面的更新、网络新闻、电子邮件、数据库信息变化等,并将用户所需信息通过电子邮件或其他方式主动提供给用户。
(3)虚拟图书馆。利用人工或搜索引擎以及“机器人”“爬行者”等软件在Internet上不断搜索满足条件的URL,然后将分布在因特网上相关网页的URL收集起来,对其进行标引,形成倒排档。倒排档中每条记录的文献标识均指向相应网页的URL,用户通过检索获得匹配的URL,通过超级链接可以调出相应的网页。
(4)信息推送技术。所谓推送技术(Push Technology)又称Push,Web广播等,是由Pointcast-Network公司在1996年首先提出的。它与有关媒体合作,利用其信息推送软件,向Internet的广大用户主动地发布、推送各种新闻、财经、体育等信息。该软件根据用户事先向系统输入的信息请求(用户个人信息档案、个人信息主题、研究方向等),就能主动地在网上搜索出符合用户需求的这些主题信息,经筛选、分类、排序,按每个用户特定要求,在适当的时候传送到用户指定的“地点”。推送技术服务突出的是信息的主动服务,即改“人找信息”为“信息找人”,通过邮件、频道推送、预留网页等多种途径,送信息到人。
(5)交互式信息服务。网络信息是虚拟的数字化信息,用户通过Internet对因特网上大数量、多类型、多媒体、非规范的信息资源进行交互式描述和处理,使数字化图书馆更贴近用户的需求。
(6)个性化信息服务。针对用户的特定需求,主动向用户提供经过集成的相对完整的信息集合或知识集合。一是根据用户自身的兴趣、爱好和需求定制自己所需要的网络信息和服务;二是网络信息提供者针对用户的个性和特点,主动为用户选择并传递最重要的信息和服务,并根据需求变化动态地改变提供的网络信息资源。
2 网络环境下学术信息交流的开放存取机制
2.1 开放存取的产生及其内涵
在网络环境下传统出版方式的学术信息交流模式面临越来越多的挑战:有限的印刷出版能力不能适应科研成果迅速增长的需要,印刷出版周期过长也给用户带来种种不便;印刷型期刊及其电子版本的价格不断上涨,使图书馆经费预算产生困难;谁来负责保存数字化学术成果资料变得越来越不确定;印刷型文献内容单一、出版周期长、流通渠道不畅、可获得性差(如付费使用)等缺点,也影响信息的正常交流。
网络环境下科学研究呼唤新的学术交流机制。研究机构需要保护自己的知识信息及知识产权,包括尚未在期刊上发表的知识,科研人员希望能够全面、准确、及时地获取最新的科研进展以及成果与思想。而网络环境下科研人员的信息交流存在着很多障碍,如网络平台、媒体类型、信息格式处理与转换等技术障碍,学术信息搜索、获取、服务等管理障碍。由于客观上存在着上述这些问题,开放存取机制便应运而生。它通过建立机构数据仓库系统,借助先进的信息组织与知识管理技术,收集机构内部产生的各种学术信息,以网络方式出版、发布,建立开放存取联盟,辅助功能强大的搜索引擎进行揭示服务、联邦检索服务等,最大限度地推动科研成果信息的传播与交流,使科研人员可以及时、方便、快捷地获取所需要信息。
开放存取(Open Access,OA),即通过公共网络可以免费获取所需要的文献,允许任何用户读取、下载、拷贝、分发、打印、检索以及获取在线全文信息,支持爬行器搜索并建立本地索引,支持用于法律允许的其他目的(不包括商业、法律、技术贸易壁垒方面的应用),唯一的限制是复制与发行。开放存取增强了学术信息的可获得性,打破了使用权限的障碍。开放存取服务包括多种类型:在线文档发布、科学家与研究组内部的直接交流、通过电子邮件的自由辩论、讨论组及相关服务、搜索引擎的索引与检索服务、第三方集成检索服务等。
2.2 开放存取的实现方式
(1)基于OAI(Open Archive Initiative)的开放元数据机制。OAI对开放存取产生了深远的影响,它最初起源于电子出版界的互操作项目,目的是开发并推广开放互操作协议标准,实现高效的信息交流与传播。因元数据格式过多,系统间互操作时元数据格式转换和匹配是一个很大的障碍。为此,OAI将资源与服务分离,提出数据提供者、元数据收获与服务提供者的组织机制。数据提供者的主要目标是开放自己的数据,系统遵循OAI标准,建有标准元数据访问接口,支持基于OAI-PMH的元数据收获。著名的系统有arXiv,CogPrints,Virginiatech大学学位论文数据库EID Individuals等。服务提供者提供两种检索服务,即联邦检索(FederateSearch)与集中检索。联邦检索采用同步方式,将用户检索请求同时提供多个OAI数据源,各个数据源独自进行检索操作,并返回检索结果。集中检索利用OAI收获器,将分散的OAI资源元数据收获到本地,并建立本地存储、索引系统,提供集中的检索和全文链接服务。著名的服务提供者有Southampton大学的 Eprints,OldDominion大学的ARC,OCLC的 OAIC 和FSConsulting 的 my. OAI等。元数据收获实现数据提供者与服务提供者之间的协议解释与转换。收获器遵循OAI-PMH协议,以POST或GET方式将OAI请求提交给数据提供者,数据提供者对请求进行处理后,返回XML格式的文档信息;收获器对XML文档进行解析后,生成本地存储格式的数据,并建立本地索引,提供集中检索服务。
(2)基于DOI的永久性保存与利用机制。学术资源永久性保存和利用是开放存取的一个重要目标。为实现这一目标,需要为每个资源分配一个永久性的、唯一的标识符,也称数学对象标识符(Digital ObjectIdentifier,DOI)。用户通过DOI可以在任何时候,唯一获得指定的信息对象从而保证用户创建的书签、个性化链接等信息永久有效。DOI管理系统一般包括5部分:命名域(namespace)、唯一标识符、命名机构(Nameing Authority)、命名登记机构(Registry)、地址解析系统(Resolution System)。当前,在采用DOI管理框架的开放存取系统中,Dspace具有一定的代表性。Dspac利用CNRI Handle System创建了全球唯一的对象标识符,虽然CNRI的Handle没有在IETF(Internet Engineering Task Force)注册,但它与IETF的URN(UniformResource Name)规范完全兼容。一个Handle系统包括3项主要功能,即Handle的分配、管理与解析。Dspac采用Handle系统为每个信息条目(item)、资源绩(Collection)和社区(Community)创建永久性标识符。为实现Handle的创建与管理,每个使用Dspace的网站都必须从CNRI获得一个Handle前缀,在指定前缀下为自己的资源分配标识符,以保证标识符的唯一性。Handle标识符有两种表现形式:
hdl:1721.123/4567 http://hdl.handle.net/1721.123/4567 这两个标识符指向同一个资源。第一种方式适合描述物理存放位置永久不变的资源,它需要使用专门的客户软件(Handle Resolver)对Handle进行解析;第二种方式用URL形式,再通过代理服务器将URL映射为本地具体资源。Dspace采用第二种方式,它更易于Web浏览器兼容,同时可以充分利用HTTP协议支持URL重定向的特性,当资源在长久保存中存放位置发生变化时,通过重定向机制,仍然可以找到该Handle初始指向的资源。
2.3 开放存取是网络时代学术信息交流的新模式
开放存取思想符合网络时代信息交流的特点,是一种新的高效的交流模式。目前对开放存取的研究呈现出蓬勃发展的趋势:
为解决学术成果出版、发布问题,促使学术信息在因特网上广泛自由地使用,OSI(Open Society Institute)于2001年12月布达佩斯会议上提出开放存取的思想并创立了BOAI。BOAI包括两个主要目标:一是建立学术信息自管理系统(Self-Archiving),即通过建设研究机构数据仓库(InstitutionalRepositories),搜集、组织、保存、发布机构内产出的知识信息,并向全社会提供免费的共享服务。二是建立开放存取期刊(Open-Access Jouurnls,OAJ)。BOAI通过要求作者拥有著作权或将其转让给出版者的策略,保证著作在网络环境下开放存取的合法性,并建立专家评审制度,保证开放存取期刊论文的质量。
开放存取期刊发展的一个显著特征是:传统出版商纷纷加入到开放存取期刊行列。2003年5月12日,在OSI(the open Society Institute)的支持下,Lund大学图书馆与SPARC(The Scholarly Publishing and Academic Resources Coalition)联合创建了DOAJ(Directory of Opre AccessJournals),其宗旨是增加开放存取学术期刊的透明性、可用性、易用性,提高期刊的使用率,扩大学术成果的影响力。2003年10月22日,德国中心研究院与其他几个研究院联合发表了“柏林宣言”,宣布将自己的科学发现提供给开放存取工程,并鼓励在科学出版领域推行开放存取机制。2003年11月3日,英国牛津大学出版社宣布与牛津大学图书馆合作参加SHERPA项目,允许全球科研人员在线免费搜索访问2002年以来牛津大学作者出版的学术论文。斯坦福大学的High Wire出版社将其出版的期刊提供全文免费网络服务,到2004年6月已开放论文716 600余篇,被称为全球最大的免费全文学术论文数据库。
开放存取运动吸引了众多组织机构,如美国国会图书馆,Harvard Virginia Tech,LoasAlamos,Comell 大学,CNI(coalition for NetworkedInformation),NSF(National Science Foundation),Mellon基金会等,著名的研究项目有SHERPA,SciX,Dspace,Eprints等。
3 结语
开放存取研究工作得到了广泛重视,很多国家纷纷开展自己的开放存取研究项目,国际化开放存取组织开始出现,并在数据库的互操作、组织管理、协调指导以及未来发展趋势等方面展开研究。我国图书情报界有识之士亦在2003年就开始了开放存取方面的研究。研究内容覆盖众多学科,既有综合性的资源数据库,又有专门的学科数据库,形成了全球化的发展趋势。
开放存取代表着未来信息交流的发展方向,作为新生事物,它所涉及的有关管理方面的问题、知识产权方面的问题、技术方面的问题都将是人们要认真面对的。
参考文献
[1] 董小英,马张华.互联网信息资源的检索利用与服务[M].北京:北京大学出版社,2003.
[2] 陈光祚.因特网信息资源深层开发与利用研究[M].武汉:武汉大学出版社,2002.
[3] Alam McCord.Institutional Repositories:Enhancing Teaching Learning, and Research[EB/OL].[ 2004-05-02].http∶//www. Educause. edu/ir/library/pdf/DEC0303.pdf.第一作者简介:贾玉萍,女,1954年9月生,1979年毕业于河北师范学院中文系,馆员,承德石油高等专科学校图书馆,河北省承德市,067000