汉王公务助理上市 政务办公提速在即
来源:硅谷动力 更新时间:2008-03-11

 
 
 
   近日,我国致力于文字识别技术研究的汉王科技,推出了识别率在99%以上超强识别能力的中文录入工具——汉王公务助理。该款产品是为政府办公信息化建设量身打造,采用了多字体大字符集汉字、图表识别与版面还原等领先全球的OCR技术(光学字符识别技术),是目前国内唯一一款针对政府办公专用的文字录入工具,整页资料,一键录入,复杂版面,原样保留。业内人士普遍认为,该产品的上市将提速我国政务办公的发展。

相对于互联网及相关硬件设施的飞速发展,政府机构海量文件与档案的信息化过程则显得缓慢而拖沓,电子政务网络的建立只需要几个月的时间,而文件与档案的信息化通常需要几年。十几倍的速度差,已经让很多政府机构意识到,手工作业的高成本、低效率已经成为政务办公发展提速的瓶颈,是否能够改变这种局面将对我国政府办公效率、政府形象以及政务处理等有着深远的影响。

海量的档案与文件的信息化,很多单位都在使用OCR技术,OCR技术是利用光学技术对文字和字符进行扫描识别,进而转化为计算机内码,以电子文档的格式表现出来。通过输入设备输入的整页的红头文件、年鉴、政策法规、文献等,将由计算机上的识别系统自动生成汉字文件,直接进WORD中,替代人工键入汉字和表格的工作,从而大大提速电子政务的发展。目前市场上有各种扫描仪捆绑的OCR软件,但由于技术含量低,功能比较单一,对文字、表格的识别效果较差,尤其是表格识别的效果尤为差强人意。这种识别率低或者不能识别就意味着仍然需要依赖于大量的人工作业,显而易见,这类扫描仪产品并不能够真正地提高电子政务信息化的速度。

国家“863计划”对OCR技术的研究给予了很大的资助,促进了中国OCR技术的迅速进步, 作为该计划重点支持项目的汉王OCR技术,在技术应用上已经非常成熟,日前已获得北京市科学技术一等奖。汉王公务助理正是采用汉王OCR技术和最新智能提取(IE)技术,可对公文、卷宗、档案、名片等纸质资料进行精准扫描识别,快速录入各种文字、表格、图像,还可将数码相片、PDF、BMP、CAJ、HTML等格式文档中的文字、表格识别后轻松转换成可编辑的文件。据了解,汉王公务助理的最大特点是公章识别,可对纸质文件中的图章、红头进行快速提取。在提取过程中,可自动进行识别分析,把文字和图片剥离,形成电子文件。由于公章是政府文件中的一大特色,这一个技术难题的解决迅速提高了文件的录入效率。

作为我国OCR技术研究开发队伍中的导航人,汉王科技的刘昌平博士认为:OCR技术的最大难题是多字体大字符集简繁混排、中英文混排的识别,表格的识别及复原,汉王公务助理应用了所有这些最新技术,它将被广泛应用于我国的法院、政府、军队、税务、水利等单位,使海量的沉睡信息得以高效利用,大大加速电子政府信息化的进程。