7月1日,中国共产党将迎来第85个纪念日。85年的伟大历史给党和人民留下了宝贵的精神财富,也形成了丰富而珍贵的文化。然而,美中不足的是,这些精神财富大多成为资料室、图书馆中的档案、文件,其中的绝大部分以纸质形态沉睡,不能被及时传播和利用。特别是在如今的网络上,一些低俗的网络文化和人生价值观正四处蔓延。因此,如何高举我党旗帜,积极弘扬我党文化,捍卫健康、积极的人生观是非常重要的。而这一切都需要把沉睡的党建资料“复活”,转化成可随时利用的电子资料。新时期下,如何将党的光辉历史文化通过信息化的手段,为各界人民群众所认识和接受,是摆在党务工作者面前的新课题。
党务管理的信息化不是一朝一夕的事,更不单纯是党务工作者的事,同时也需要相关高新技术企业也参与进来,为党务管理的信息化提供高科技的支持与帮助。为此,党务管理工作需要利用现代企业创造的高科技设备来提升工作效能,继承党的精神财富,弘扬党的优良文化,让党务管理满足新时期信息化建设的新挑战,与时俱进。
事实上,我国在80年代后期就投入了大量资金进行政府信息化建设工程,其中对党务信息化建设的投入也很重视,然而在建成初步的信息化网络和硬件设施之后,党务工作人员发现将海量的资料进行电脑录入的信息化处理是一项庞大而繁杂的工程,特别是这些资料中存在的图片、表格、多语种等大量的复杂版面,用手工处理极其耗时。而在一些特别珍贵的党建资料中,还存在大量的公章与文字混排,用普通的扫描处理进电脑,图章和文字不能剥离,就会阻碍党务档案电子化进程。
我们知道,要解决这些问题,首先要实现纸质文件的电脑识别,通过高科技设备来完成录入工作,将海量档案与文件的快速电子化。目前最有效的办法就是采用OCR技术,对文字和字符进行扫描识别,进而转化为计算机内码,以可编辑的电子文档格式表现出来。
汉王科技公司是我国在OCR技术方面的领导者,自1985年就开始从事OCR技术的研究工作,就受到国家863计划、国家自然科学基金委员会的重点支持。多年来,汉王科技一直致力于为政府办公信息化提供解决之道,而党务资料电子化是政府现代信息化建设的典型代表。汉王OCR针对党务信息化专门研发的中文快速录入工具——公务助理文本王,实现了资料、文献的一键录入,文档可以输出到指定的Word、Excel等电子格式,识别率高达99.8%,这样的识别率远远超过人工录入的错误率。要解决党务资料的保存、查找、利用,仅仅解决字的识别是不够的,能否识别表格也是党建工作者关心的问题。表格的重要特征是除了文字以外还有表格线,特别是斜线、断线,同时表格在文档中所处的位置不同,表格里的内容有可能是汉字,也有可能是数字、字母等,这都增加计算机判别的难度。汉王公务助理成功的克服了这些困难,对表格的识别率达到了99%以上,在全球OCR领域中屈指可数。
在处理党务档案中,由于很多资料极其珍贵,造成它的使用性受到限制。就是普通的阅读,也会对这些珍贵的资料造成大量的伤害,因为每翻阅一次,这些珍贵的资料寿命就会减少60年。因此很多资料只能藏在博物馆、图书馆中。只能保存,不能让使用者随便利用,形成“用”与“藏”的矛盾。所以,同步解决珍贵资料的文献价值和文物价值是非常重要的,公务助理通过版面分析和版面还原技术,可对这些资料进行数字化加工和再造,对这些资料进行原版面复制,让资料在纸上什么样,电脑里就什么样,彻底的解决了“用”与“藏”的难题。
汉王公务助理的出现,解决了党建资料中的各种带有公章、图章文件电子化难题,用公务助理智能提取技术,可轻松把资料中的文字和图章自动剥离,形成独立的文字和图片。同时,公务助理还捆绑强大的屏幕识别功能,还可将对珍贵的党建资料用数码相机拍照,然后导入电脑中,自动识别成可编辑、可查询、摘抄的WORD文件。因此,再多的资料也可以很快被输入到电脑,传送到网络中。
作为我国OCR研究开发队伍中的导航人,汉王科技的刘昌平博士认为,汉王文本王公务助理目前应用的版面分析、字符识别、表格识别、版面还原等技术,每一项都是在几十年的研究积累的基础上实现的,正是因为这样强大的技术保障,才能是对党务信息化的建设取得立竿见影的效果。而作为致力于汉字识别领域的领先企业,汉王为能把这项技术应用于党务管理而感到自豪。在这里,我们很高兴我们自己的高科技企业,用自己的技术解决了长期阻碍党信息化建设的“纸老虎”的刁难,同时也期望汉王科技能继续发扬创新精神,创造出更多,更好的产品,为现代政府信息化建设提供全方位的服务。