汉字在信息时代浴火重生
来源:科技日报 更新时间:2012-04-15

 
  汤帜的手机每天都能收到几十份手机报,与别人不同的是,他看的不是常见的彩信报,而是通过GPRS接收的带版式的手机报。而这每一份报纸都是利用“方正数字手机报”技术制作的。

  作为方正Apabi公司的首席技术官,汤帜阅读手机报更多的是为了检验自己开发的技术是否还有什么缺陷。

  “我是1987年从北大无线电系毕业的,那时还不知道激光照排是什么,也没有想到今后会干这行。那时的计算机里基本上都是西文,汉化的操作系统还在起步阶段,更不要说输出打印了。我们毕业时的论文都是手写的。”汤帜告诉记者。

  的确,我们今天能够在计算机屏幕上、电视上、手机上读汉字、写汉字、印刷汉字,全拜汉字信息处理技术的发展,以及以王选为代表的中国研发人员的自主创新。当全球的印刷出版业在信息化时代正经历着脱胎换骨的革命之时,汉字的信息化处理和印刷技术革命早在30年前就已经开始了。

  “被打字机抛弃的文明”

  20世纪80年代,外国科学家断言,如果中国不放弃方块文字,将无法进入信息时代。

  1984年的《参考消息》有这样的记载:“法新社洛杉矶8月5日电新华社派了22名记者,4名摄影记者和4名技术人员在奥运会采访和工作。在全世界报道奥运会的7000名记者中,只有中国人用手写他们的报道……”

  在20世纪上半叶,英文打字机的普及极大地提高了文字资料的录入速度。但由于汉字的复杂性,中文打字机迟迟未能设计出来。之后,虽然设计出中文打字机,但要配备数千个铅字组成的大字盘,昂贵的机器成本和复杂的使用技术令其难以普及。对此,国家领导人也深感无奈,甚至发出中文“要走世界共同的拼音文字道路”的慨叹。这些限于历史条件的言论,在中文信息处理技术发展中常常被提及。

  中科院计算技术研究所软件实验室的张华平研究员指出,汉语主要特点为完全使用由象形文字演化而来的方块汉字,且字数多、字体多、相似字多、笔划多,而且结构复杂,用计算机进行处理困难很大。汉字成了“被打字机抛弃的文明”。

  于是,“汉字拉丁化”的呼声甚嚣尘上。难道我们五千年的文明传承,就这样断送在信息时代?难道流传千年的汉字,真的会被电脑拒之门外?谁能让电脑屏幕显示中国汉字,又有谁能把汉字带进现代化?

  感谢王选

  “只要你读过书、看过报,你就要感谢他,就像你每天用到电灯要感谢爱迪生一样”“您的名字,已经被‘印刷’进人民的心里”……

  2006年2月13日,王选因病逝世。社会各界纷纷以不同方式表示哀悼并给予高度评价。一些网友如此形象地表达对王选的敬意。

  王选逝世后,北大在百年讲堂布置了灵堂。来到灵堂悼念他的许多人都是生前不认识的,但这些人都得益于他的一项伟大发明———汉字激光照排技术。这项发明,结束了中国人使用了近千年的活字印刷术。

  公元11世纪,毕昇发明了活字印刷术。这些单独烧制的陶字,可以被重复利用,在当时,这种印刷术大大地领先于西方各国。活字印刷一直被中国人使用到1980年前后。

  上个世纪70年代,全球进入到信息爆炸时代,各种平面出版物的数量激增,这时的活字印刷术已经无法跟上出版的需要。

  为了解决这个问题,西方国家用了40年时间,才从第一代照排机发展到第四代激光照排系统,而王选发明的汉字激光照排系统,却使我国从落后的铅字排版一步跨进了世界最先进的技术领域,使得我国印刷业的发展历程缩短了将近半个世纪。

  汉字激光照排技术始自1975年。王选生前的秘书丛中笑回忆道:“那时,他还只是北京大学一个默默无闻的‘小助教’,并且已经在家重病休养了十多年。”激光照排就是把每一个汉字,编成特定的编码,存储到计算机,输出时用激光束直接扫描成字。

  丛中笑告诉记者,在王选之前的计算机存储汉字思路一直是用点阵的方式。但汉字笔画多而繁杂,每个字又有十多种不同的字体和字号,用点阵方式既占据计算机极大存储量,又不利于字的放大及缩小,因而不可能表示很多字体。王选最重要的发明是“轮廓加参数描述汉字字形的信息压缩技术”,就是将横、竖、折等规则笔划用一系列参数精确表示,曲线形式的不规则笔划用轮廓表示,使汉字信息压缩倍数达到500∶1,并实现了失真程度最小的字形变倍和变形。这一技术解决了激光照排最核心的问题———巨量汉字字形信息存贮和输出,并在世界上首次提出并实现用附加信息控制字形变大变小时敏感部分的质量。 
 
 直到10年以后,西方才开始采用类似的轮廓加提示信息技术。

  此外,王选还设计了适合硬件实现的、失真最小的高速还原汉字点阵算法,以及加速复原的超大规模专用芯片,使复原速度达到710字/秒。克服一系列技术难关后,制成了用于解释排版结果、形成版面点阵、控制输出设备的汉字激光照排控制器(现称栅格图像处理器RIP)。上述技术获得了1项欧洲专利和8项中国专利,并获首届中国发明专利金奖。

  然而,当时在很多人看来,搞数学出身的王选提出的这套方案,是“数学畅想曲”、骗人的“数学游戏”。但王选坚信自己的方案是未来的发展方向,可以让中国在这个领域得到跨越式发展。

  1985年,激光照排系统开始在新华社投入使用,出版《每日新闻稿》和《前进报》。

  1987年,经济日报社作为全国第一家报社,顶着压力、冒着风险,开始采用王选的激光照排系统出版日报。

  据经济日报社印刷厂原厂长夏天俊回忆:这套系统开始时每天都会出错,比如说把“中央电视台”排成了“中央电视合”,报社几乎每天都会刊登致歉信。最后王选立了军令状,20天解决问题。

  靠着这最后的坚持,经济日报淘汰了铅版印刷,出版了世界上第一张采用计算机屏幕组版、整版输出的中文报纸。从此中国的印刷业告别了铅与火,走进了光与电的时代。

  自主创新的里程碑

  王选用极富想象力的思路和巧妙的方式,不仅让汉字在信息时代浴火重生,汉字激光照排系统也铸造了北大方正集团的辉煌,打破了西方对汉字处理及印刷技术设备的垄断。之后的不断创新,使我国的出版印刷技术实现跨越式发展,最终形成一个前途光明的新兴产业。

  从远程传版技术、彩色桌面出版系统到新闻采编流程管理系统以及直接制版系统,王选不断让方正诞生新的技术成果,并在全面占领中国市场之余开始向海外进军。上世纪90年代以来,《澳门日报》、香港《明报》、台湾《联合报》等港澳台各大报社及东南亚和北美的华文报纸纷纷开始采用王选的中文电子出版系统。目前,国产电子出版系统占据了全国99%%的报业和90%%的黑白书刊市场,以及90%%的海外华文报业市场。

  在此基础上,王选主持策划研发的方正新型日文出版系统于1997年打入日本市场,这是中国企业第一次较大规模地出口和销售拥有自主知识产权和产品品牌的高科技应用软件。目前,日本已有300多家报社使用该系统。1999年以来,西文出版系统和栅格图像处理器也先后进入欧美市场。

  汉字激光照排系统的推广应用,不但消除了铅毒污染,降低了能耗,更重要的是大大提高了印刷生产能力,出版周期由300天缩短到100天左右,出版品种大大增加。据统计,1980年全国各类印刷厂仅1万多家,2007年全国有各类印刷打字企业18万多家,工业总产值超过4000亿元。从1978年到2008年,我国图书品种由12886种增长到248283种,增加了近20倍,报纸也由1977年的200种、123.7亿份增长到2007年的1938种、438亿多份,而且报刊的信息量加大,新闻时效性增强。这种数字化的转变,使得我国新闻出版印刷业脱胎换骨,让汉字文明汇入了世界信息化、网络化的潮流。

  世纪之交,中国工程院、中国科协以及有关部委联合进行了一个“20世纪我国重大工程技术成就”评选,“汉字信息处理与印刷技术革命”高票入选,位列“两弹一星”之后,排在第二位,成为我国工程技术自主创新的一座新里程碑。

  作为王选亲自带出来的研究生,汤帜目前已经成为了出版印刷技术领域的领军人物。他告诉记者,前几年人们谈到数字出版时,通常只谈数字化形式的出版物,但随着数字出版的发展,数字出版的范围已经延伸到出版过程的数字化。数字出版物包括电子书、电子期刊、数字报纸等等,更进一步发展为以条目数存储发布的电子图书、以一张张图片为单元存储发布的艺术作品等数字出版形式。汤帜描述的出版印刷业未来发展趋势:从出版全流程数字化、跨媒体出版,到网络电子书和音像制品的数字版权保护、电子阅读器……让喜爱阅读的人和信息获取者有了更大的选择空间。