谁为自主创新“添把火”? 一项“突破”性技术的呼唤
来源:新华网 更新时间:2012-04-14
 
 

  新华网北京1月22日电(记者 李斌、周婷玉)“谁来帮帮我们?为自主创新推波助澜?”全国科技大会结束不久,一项中文字形技术——汉峰字形技术发明人之一的孙海东就发出了呼吁。
  新年之际,这项历时12年攻关、被权威专家誉为“突破”的原创性中文汉字信息处理技术,正走到产业化进程的大门口,面临两难选择:是甩掉沉重的资金压力,卖给国外竞争对手?还是“饥寒交迫”继续战斗?
  终成正果
  字库,是储存在电脑、手机等设备里的文字“仓库”。
  人们追求美丽和多变,对文字也不例外。然而,目前的事实是:电脑里人们可以看到多种字体的汉字,还可变化;手机等嵌入式设备里不仅无法选择字体,也不能变化,许多汉字更是找不到。
  这是因为技术难以实现。电脑和嵌入式设备为此执行了不同的中文字符集标准和不同的字形技术。前者是包含2万7千多字的国家标准GB18030-2000,后者是只包含6763个汉字的国家标准GB2312;前者采用的是轮廓字形技术,后者采用的是点阵字型技术。
  在中文字库领域,占据电脑字库垄断地位的是美国微软公司的专利字形技术——TrueType字库。由于核心技术被跨国公司掌握,国内企业都必须跟从微软的技术标准进行汉字字库的开发,基本丧失了汉字字库的自主创新能力。
  随着信息化的推进,对中文字形的要求愈来愈高——现有汉字太少,而且不能变化,占用空间也太大——无论是电子政务、电子警务、办公自动化、印刷出版行业,还是向高分辨、大显示屏方向发展的手机、PDA、数字电视,都急需超大字符集的支持,都在呼唤更为丰富美观的字体和字形。
  然而,在市场被跨国公司基本占据的背景下,绝大多数人选择了放弃,认为“不可能”。孙海东却对汉字字库技术矢志不移,一做就是十多年。
  1993年,他对中文字库技术的现状与应用进行了全面调研,找到了主攻方向:开发世界上独有的嵌入式汉字曲线字库技术。
  经过反复攻关,尤其是2003年以来,在上海市、徐汇区等各级政府部门的支持下,孙海东所在的上海汉峰信息科技有限公司于2004年成功完成了MiniType字形技术和字库产品的研制,实现了以笔画中心线为基础的结构化构字技术。
  “解决了几十年没有解决的问题”
  新字形技术包含7万多个汉字,分为宋体、仿宋、楷体、黑体4种字体,可轻松变瘦、变胖,也可以拉扁或伸长。与国际同类字库技术相比,新字形不仅优美、还原速度快,而且存储量只有1/10。它不仅已获得国家发明专利证书,还申请了美、日、韩、欧盟等8个国家和地区的专利。
  “这个领域,人们原来认为已经很难创新了。”汉峰字形技术的出现,让“汉卡”发明人、中国中文信息字会理事长倪光南院士喜出望外:“又要字形美观,又要容量紧凑——汉峰字形技术实现了这个目标,解决了几十年没有解决的问题,体现出了中国字形的特色。这是一项原始创新。”
  在认真评议后,倪光南、沈昌祥、何新贵等院士组成的鉴定委员会认为,新字形技术具有创新性和实用性,是我国中文字形处理领域的一项突破。它与目前普遍使用的曲线轮廓字形技术相比,在嵌入应用和移动应用中具有明显的优势,整体性能指标达到国际领先水平。
  值得一提的是,用这一技术制作、符合国标GB18030-2000的4种字体汉字字库已通过国家信息处理产品标准符合性检测中心检测,获得了“市场准入证”,进入了市场应用阶段。
  正在全国各地发放的第二代身份证,遭遇冷僻字“阻击”。据说北京就有数万个身份证因为人名地名是冷僻字无法发放——电脑字库没有这些字!为此,公安部第一研究所和汉峰公司联合研制出了适用于人口信息系统的“汉峰文字支持平台”,包括7万多个汉字及手写、拼音混合输入法,符合被称为“超大字符集”的新国家标准GB13000-2003。
  “我们的字库不仅能‘放大’到7万多个汉字,而且由于掌握了构字的核心技术,能迅速开发出不同语言的字库。理论上说,世界上数百种语言的字库,我们都能迅速构建。”孙海东说。