报业数据库建设是实现数字报业战略的重要内容
来源:中国报业杂志 更新时间:2012-04-15


  一、中国新闻传播业数据库概述

  计算机、网络、数据库是构成当今世界现代信息社会的要素。

  数据库产业既是一个高投入的产业,又是一个高技术产业。数据库的建设需要采用科学的信息组织和加工方式。由于数据库产品有着巨大的市场潜力,数据库产业被称为朝阳产业。

  随着新闻传播业数据库建设的发展,数据库已经成为新闻媒体向用户提供新闻信息服务的主要手段之一。数据库的规模、内容和它所拥有的用户数量,已成为衡量一个媒体实力的重要标志。

  20世纪80年代,我国新闻媒体(包括报社、杂志社、广播电台、电视台、通讯社)进入计算机时代,数据库建设也随之开始起步,如新华社和北京电讯工程学院合作开发了采用关系型数据库ORACLE建立的新闻资料检索系统,并于1989年4月通过了由机械电子部和新华社共同主持的技术鉴定。进入90年代,报社的数据库建设迅速展开,标志性的事件是1992年8月,TRS与人民日报社合作开发的中文全文按词检索系统在人民日报社投入运行。我国新闻媒体数据库经过10多年的努力建设,不论是数量、规模,还是质量、水平,都取得了长足的进步和快速的提高。

  我国新闻媒体于20世纪90年代中期进入互联网时代后,经过10余年的发展,今天几乎每一家媒体均已在互联网上建立网站,因而为公众提供查询服务的在线数据库的数量也在不断增加。

  近年来,随着数字化进程的加快,新闻媒体更加重视数据库的建设,各新闻单位纷纷投入大量人力、物力和财力,开发以满足新闻信息资源整合、共享为出发点的,面向市场的多媒体数据库产业。目前,一批具有相当实力的数据库厂商已经崛起,一些新闻媒体和机构基于海量信息资源数据库提供新闻信息服务,其用户规模和经营收入已相当可观。

  新闻媒体数据库不但有着一般数据库建设的共同技术要求,而且还有其独特的特点,这主要表现在:信息时效性强、信息入库量大、用户查询量大、数据需要各个子系统的共享和相互间的访问等。

  新闻媒体数据库按内容分类,可以分为全文检索数据库、图片数据库、多媒体数据库等;按工作性质分类,可分为待编稿件数据库、采访线索数据库、成品稿件数据库(新闻历史资料库)、客户关系数据库、分类广告数据库等。

  由于众多媒体均已在互联网上建立网站,可为公众提供查询服务的在线数据库的数量也在不断增加。

  在报业领域,新闻媒体数据库技术应用不断向纵深发展,从全文检索技术,发展到覆盖内容采集、创建、传递、分析等完整的内容全生命周期的内容管理技术,实现了文本自动分类、聚类、关联分析、摘要、排重和相似搜索等功能,做到了文本挖掘技术的产品化和实用化,为智能化和个性化信息处理打下了坚实的技术基础,将知识管理技术与内容管理技术相互融合。

  在广播电视业领域,从新闻媒体数据库发展到媒体资产管理系统,实现了媒体资产数据的存储与再利用,满足了管理与应用两个核心要求,媒体资产拥有者可以创建、挖掘、存储、管理、应用、发布各种形式的信息。

  新闻媒体数据库在媒体中的地位越来越重要,作用越来越显著。它是对新闻信息资源进行整合、共享和优化配置的先进技术手段和平台;是新闻信息的新载体(媒体);是新闻信息资源增值的手段。

  我国新闻媒体数据库的建设极大地推动了整个行业数字化的进程,它的开发利用极大地改变了整个行业的面貌。

  随着信息化建设的普及和深入,我国新闻传播业已基本实现数字化和网络化,积累了大量的数字资产。数字资产的整合和再利用是普遍面临的问题。在媒体竞争日益加剧的情况下,数据库建设是新闻传播业的核心环节。

  二、他山之石——新华社多媒体数据库的成功经验

  综观新闻媒体数据库的建设,我们注意到这样一个特点,一般来说,规模较大的新闻媒体和机构比较重视数据库的建设,不但投入大,而且在技术和应用上都有不少创新之处,规模和效益比较明显。如新华通讯社、中央电视台、人民日报社等单位的新闻数据库各具特色,为业界提供了可供借鉴的宝贵经验。

  2003年新华社建成开通的多媒体数据库,是新闻行业数据库应用的典范,其中的创新成果和先进理念,值得我们报业在数据库建设中加以学习。

  我们以往的新闻数据库往往是作为新闻资料库,而新华社多媒体数据库的功能和作用远远不止于此。

  新华社多媒体数据库是对新闻信息资源进行整合、共享和优化配置的先进技术手段和载体;新华社多媒体数据系统的建设,实现了新华社数字资产的全面管理,是其实现全球信息总汇目标的可靠技术保障。

  新华社多媒体数据库中的待编稿库,将新闻共享提前到新闻稿件的初创阶段。以前,新闻的共享是已经发表或发布的新闻的共享,即成品的共享,而现在,记者采写的稿件都要第一时间放到待编稿库。这是一个先进的理念,由此引发的新闻生产和组织方式的变革,使新闻生产力借助先进的技术得以有效地释放和发展。新华社多媒体数据库技术与应用的创新对新闻界具有十分重要的借鉴意义。

  新华社多媒体数据库的功能特点如下:

  ——新型内容生产方式。在新华社内部的新闻生产过程中,利用多媒体数据库平台,合理调配采编力量,实现了新闻、信息原料的统一采集、共同使用,改变了多头采访、重复编辑、资源浪费的现象;新华社多媒体数据库,为新闻信息资源的共享提供了手段,从而可以更方便地实现分层次编发稿件,编发背景资料,推出各种方式的个性化服务,以及实现文字和图片报道在采编环节上的互动

  ——优化产品结构的工具。新华社多媒体数据库也是建立融合文字、图片、音频、视频为一体的多媒体发稿系统和营销平台的先进技术手段和产品平台;新华社以多媒体数据库为中心,整合各种新闻资源,灵活调整产品结构,为海内外广大用户提供了全方位、多层次、多品种的个性化服务的新系统。

  ——信息资源整合的手段。新华社多媒体数据库集新闻信息收集、储存、加工、管理和服务为一体,除了可以对外提供信息服务外,在整合全社信息资源方面发挥了重要作用,实现了信息共享,打破了多年形成的新华社内部资源分割、利益多元、相互竞争、合力不强的情况,为实现建设更加强大的世界性通讯社目标打下了坚实的基础。

  ——对外信息发布的平台。新华社多媒体数据库为世界新闻同行提供了一个富有效率的信息平台,特别是对全世界的华文媒体,是一个很有意义的工具。不但可以24小时提供用户最新消息,而且可搜寻数十年来新华社所累积的宝贵资料。

  2006年6月28日,新华社联合国分社在美国曼哈顿亚洲文化中心,举办了一场主题为“让世界了解中国,让中国走向世界”的新闻发布会,这是新华社首次在北美公开向华文媒体推介多媒体数据库,反响和收效良好。这反映了新华社数据库经营理念的变化。

  三、报业数据库建设是实现数字报业战略的重要内容

  中国报业在集团化、产业化的进程中,从1996年至今已陆续组建39个报业集团。报业集团的媒体结构通常为“N报N刊1网站”。

  从《全国报纸出版业“十一五”发展纲要(2006—2010)》我们解读出如下信息:

  ——“十一五”期间,信息技术革命将导致报业市场多元化传播格局加快形成;数字报业将得到大发展,数字内容生产、传播和增值服务能力普遍提高,数字内容产品和信息增值服务收入显著增加;要提高报业集约化经营水平。

  ——确立数字报业发展战略。实现报业核心竞争能力与信息网络传播技术的深度融合。

  ——积极探索适应数字报业发展需要的新型内容显示技术和传播技术,实现传统纸介质出版向数字网络出版的平滑过渡。广泛利用各种数字内容显示终端和传播技术,发展“网络报”、“手机报”、“电子报纸”等多种数字网络出版形式。

  ——积极探索数字报业的主营业务模式,形成多种媒介形态内容产品的生产和销售能力。为广告客户和消费者提供高度定制化的网络广告产品、灵活的广告投放策略和价格组合。满足供需双方即时在线交易的需求,实现报业运营对价值链的全面整合。

  ——推进信息化建设与数字报业战略架构的全面整合,实现信息网络系统由辅助性管理手段向核心经营平台的转变,由信息技术投资向报业经营战略投资的转变。

  以上目标的实现,都与数据库息息相关。

  从根本上说,报业从事的是内容产业,其运行的基本属性是内容的生产、复制和传播。因此,内容生产是报业的根本和关键;新闻内容的原创能力是报社的核心竞争力。报社所出的报纸,以及所办的网站、手机报都是内容的载体。内容是本质,载体是形式。

  从电子报纸阅读量这一侧面,也可以看出原创内容的重要性。近两年,不少报社推出了报纸的电子版,或叫电子报纸。一个有趣的现象是,在其网站上,电子报纸的访问量与其它栏目相比,一般都是最大的。有的甚至达到其网站访问量的60%以上。这其中不乏以门户网自居的网站,这是一个很值得我们分析的现象。这说明,网民或受众看中的是我们的原创内容,看中的是我们特有的东西,看中的是我们的核心竞争力。因此,把我们报纸的内容做得更精彩,才是要务。

  只要抓住了内容这个“纲”,载体的访问量这个“目”,就会纲举目张,切不可舍本逐末。

  在我国,报业特别是报业集团一般在新闻资源占有量上具有很大的优势。问题是这些新闻资源往往处于一种分散的相对独立的状态,没有形成合力,只是物理上摆在一起,没有发生化学作用。可以预见,如果把我们这些新闻资源进行有效的整合,形成规模效益,新闻生产力就可以得到极大的焕发,收到倍增的效果。因此,利用新技术实现信息资源的整合与共享是报业发展的一个重要而迫切的需求。

  目前,尽管网站、手机报等新媒体不断涌现,但对于报社来说,报纸仍然处于主导地位。新媒体代表未来,但需要较大的投入,短期内效益难以体现。这正是我们的困惑所在。有没有一条既有利于平面媒体,又有利于新媒体,既立足现实又面向未来的双赢之路呢?有。答案就是新闻媒体数据库——既能服务于传统媒体,又能服务于新媒体,鱼和熊掌可以兼得。

  四、关于报业数据库的几点设想

  经过20多年的发展,中国报业数据库建设方面积累了大量的经验,取得了可喜的进步。但是,随着新技术和新需求的发展,面临更加严峻的挑战:运用新的技术、新的标准,提供功能更完善的新闻资料数据库;报业集团内部各子报的建库工作发展不平衡,有关新闻信息资源,亟待通过数据库建设加以整合;建立以数据库为核心的全集团统一的新闻采编管理平台的需求十分迫切。

  信息技术开发应用的思想路线,应该是从需求出发,用数据说话。在新闻技术改造、开发和引进过程中,要避免陷入从技术到技术,从产品到产品的思考方式的误区。要把满足发展新闻生产力的需求作为出发点和落脚点,这就是从需求出发;不但要做定性的分析,还要进行定量的分析,这就是要用数据说话。

  根据数字化报业的要求和技术发展的水平,就报业数据库建设提出以下几点设想。

  1. 优化结构、重塑流程,打造一个全新的采编数据库平台

  新华社多媒体数据库的重要组成部分——待编稿库,对于报业具有十分重要的借鉴意义。受其启发,我们可以建立报业的待编稿库为核心内容的全新的采编数据库平台。所谓待编稿库就是新闻素材库,一个报社或报业集团内所有报刊的记者采写的稿子,按不同类别,分别存入待编稿库。这样就形成一个大编辑部的概念。

  在这个待编稿库的基础上,编辑按一定的规则进行新闻选择,从待编稿库选编稿件签发到不同子报和网站的稿库。这样做的前提是要制定一系列的规则和考核方法,目的是鼓励记者多写稿,既要实现新闻信息资源全方位的整合与共享,又要保证原创人员的权利。

  待编稿库的应用,打破了以往部门的界限,实现了新闻原创信息在发布前的充分共享和互动,在新闻大战中可以发挥更好的作用;总编辑作为总指挥官,可以更好地掌握全局的动态信息,进行有效的调控,本报发不了,其它报可以发,报纸用不了,网站可以选用。这样就可以避免记者的工作成果。由于受版面限制,而成无效劳动的浪费现象。如此,新闻生产力就可以得到极大的开发,采编人员的创造性可以得到更好发挥。待编稿库大家看,可以避免误判。如果把好稿给毙了,你不用,别人可以用。

  如果机制有效,这个统一的数据库内容会很快丰富起来,越来越有价值。在此基础上,可以实现稿件在不同报纸的共享,可以实现稿件的一次生成多次发布——报纸、网站、手机报等。如此,可以有效地开发集团的新闻资源,从而使采编人员的价值——劳动成果,可以得到更好的体现。

  数据库本身就是媒体,我们使用百度进行网上搜索,其实就是用的数据库功能。在统一网络,统一采编数据库平台上,报社的新闻资源得以有效的整合,数据库本身就是极具价值的资源,也是媒体。数据库对外开放,通过网上检索、手机检索,就可以实现信息增值。在此基础上,开发新媒体就是水到渠成的事了,网站、手机报等只不过是不同的信息出口而已。通过资源整合,报社的内功就会大长,新媒体的开发就会纲举目张。

  新技术的应用,不应该是现有流程的模拟,而应该是流程的再造,实现过去想做做不了的事。

  2. 在新闻图片库的基础上建立新闻图片网(频道)

  随着现代生活节奏的加快,人们更钟情于读图,同时数码相机的普及也为图片的获得提供了极大的便利。在报纸阅读方面,头版头条往往记不住,但一版的图片记得很清楚;在网站也是一样,图片最有冲击力,好的图片往往有很高的点击率。

  在读图时代,建立具有特色的新闻图片网是整合资源的一个有效措施,其意义在于:一、通过发展签约摄影师以及征集社会大众来稿,可以大大扩大我们的信息渠道;二、来稿中的优秀照片可以优先为报纸采用,从而可以有效地提高报纸图片的质量,实现网络反哺报纸;三、签约摄影师与报社摄影记者相结合,可以相互促进;四、通过图片网可以实现照片的交易(报社丰富的历史照片是一笔不小的财富,经过扫描、分类、整理入库后,既可以为出报服务,也可以通过这一网站的交易实现增值);五、在吸引社会稿源的同时,可以有效地抑制内部稿源向商业图片网的外流。

  据了解,新华社有1000多名签约摄影师,起到了很好的作用;吉林日报也引入了这一理念,报纸图片的质量得以大大提高。

  3. 建立特色资讯库

  一般来说,晚报、都市报的分类广告在报纸广告收入中,占有很大的份额,这是一个强大的信息源。我们可以利用这一优势,在网站上建立相关资讯库。网站做分类资讯具有报纸无可比拟的优势,一可以有更大的信息量,二可以建立链接。

  一方面我们可以利用我们的优势,形成相关信息汇集渠道;另一方面我们可以从报纸广告中提取相关的信息。

  利用网站海量和多媒体的优势,实现报纸广告和网站广告的联合经营、内容互补、跨媒体链接,是报纸和网站资源整合、共同发展的一个有效途径。

  4. 建立读者和客户资源数据库

  随着报业市场化进程的深入,“以订单管理”为核心的系统,正在逐步向以“客户为中心”的系统发展,在“同质化”竞争越来越严重的今天,服务的质量愈显重要。

  通过对大量的客户资源进行统一管理和分析,直接了解市场和客户的需求和变化,可以更好地改善服务,科学决策,提高报社整体品牌形象和素质。

  因此,建立集团统一的呼叫中心和客户关系管理系统,建立和完善读者和客户资源数据库十分必要。这是服务读者、提高市场竞争力的重要手段。

  五、报业数据库建设的方向

  尽管新闻传播业数据库建设取得了长足进步,但是必须看到还存在不少问题,如管理运营水平不高,营销推广力度不大,不同媒体发展水平不平衡等。

  通过对有关新闻媒体数据库的研究,对于中国报业新闻数据库未来的建设与发展,我们提出以下建议:

  1. 面向标准化

  中国新闻信息国家标准的颁布,为新闻信息的交换和共享奠定了基础。但是,光有标准是不够的,接下来重要的工作,是共同开发出符合标准的数据库产品。为此,有以下几个层面的工作要做好:首先,新闻数据库研发单位要积极开发出支持相关标准的数据库应用系统;其次,新闻单位要加强标准化意识,从新闻数据的源头做起,在新闻采编的数字化进程中,采用支持相关标准的应用系统;最后,做好历史数据的标准化迁移工作。

  2. 面向新媒体开发

  新闻数据库建好了,新媒体的开发就会纲举目张,“一次生成,多次利用”便会得以实现。因此,在新闻媒体数据库的建设中,要在技术和应用上面向新媒体开发,做好衔接工作。

  3. 面向传统媒体新闻生产方式的变革

  以往的新闻数据库往往是新闻成品的数据库,也可以称其为新闻历史资料库。新华社多媒体数据库中的待编稿库、新闻线索库、报道指挥库的应用,为新闻媒体数据库应用提供了新的理念:把新闻信息的共享从新闻信息生命周期的末端——新闻成品,提前到新闻信息生命周期的最前端——新写稿件;通过数据库实现了全方位、立体化高度协同的新闻采编体系,有效地实现了新闻资源的共享,极大地解放了新闻生产力。

  新闻媒体从根本上说是内容产业,而数据库本身是内容整合的有效工具,是数字内容产业的价值体现。整合是结构的优化,是流程的再造,是力量的倍增器。以数据库为核心的应用系统在新闻媒体的推广和深入,将引发传统媒体工作方式的变革;以数据库为核心的媒体资源整合,是提高新闻媒体竞争力的重要手段。

  4. 面向市场

  数据库是朝阳产业,具有广阔的发展前景。在新闻媒体数据库的建设过程中,要注意分析受众的需求,根据不同用户、不同行业的特点,开发特色的数据库产品,最大限度地满足社会的需求。在满足社会需求的同时,经济效益就会随之而来,从而达到信息的增值。

  5. 重视自身数字知识产权的保护

  我们在利用数据库整合新闻信息资源,开发新媒体的同时,要重视数字知识产权的保护。数字知识产权保护每个报社都应从我做起,不要把自己的劳动成果不当回事,任人使用;也不要把自己的产品廉价卖给别人,要尊重自己的劳动成果。这是保护我们核心竞争力的需要。

  现在,从网上随意“搬运”别人的内容已是司空见惯,以此手段好像人人都可做内容提供商,都可以做信息增值服务。其实,这是一个很严重的问题,这个现象产生的原因主要在于知识产权保护意识淡漠。为此,我们一要加强知识产权保护的宣传,二要采取技术手段保护我们的内容。不然,就会造成“卖盐的喝淡汤,编席的睡光床”的尴尬局面,不利于我国内容产业的健康发展。

  综上所述,报业的数据库建设是实现新闻信息资源的整合与共享的有效手段,这是一个不断完善、深化的过程。需求是动力,技术是手段。我们的任务,就是与时俱进地采用技术手段,推动新闻资源全方位的整合与共享,为提高新闻媒体的核心竞争力服务。

  (作者单位:李彦魁,北京日报报业集团;闵大洪,中国社会科学院新闻与传播研究所)