目前,信息化程度的高低已经成为一个国家现代化水平和综合国力的重要标志。从世界范围来看,推进政府部门办公自动化、电子化已是大势所趋。值得注意的是,对于电子政务用户而言,需要计算机处理的信息中有大量都是来自未经识别的纸媒体文件,因此对纸媒体的低速处理和计算机的高速运行之间的矛盾已经成为信息化发展的瓶颈之一。此外,在许多无纸办公的场合,如何实现人性化和方便易用的输入方式也是一个重要的问题。这些问题带来了电子政务对输入速度和方便性方面强烈的需求,通过OCR技术和手写技术为核心的汉字通用输入解决方案来解决是一套不错的方案。
多写一笔,"写"出生动OA
许多政府部门实施电子政务,但OA系统一直没有得到很好的应用,对键盘办公方式的不适应是主要原因之一。由于用惯了纸笔,或者对输入法、拼音掌握不熟练,使得许多政府的工作人员视OA为畏途。业内人士戏言:"只因少了一笔,自动化成了白动化"。如果采用手写技术,就可以使无纸办公在许多场合显得更简单易用,更符合人们圈阅、签批乃至起草文件的习惯,大大方便了习惯纸笔的人士。
手写办公功能的核心部分是手写识别技术。目前,手写识别已经发展到了第五代技术。前四代手写识别技术可分为:能够识别工整字、繁体字的第一代;能够识别连笔字的第二代;能够识别倒笔字、简化字的第三代;拥有大字库的手写识别技术为第四代。第五代识别技术,不但性能指标有了长足的进步,而且还能够识别和输入行草字,更符合用户的手写习惯,其代表产品是汉王的"行草王"。行草王能够满足用户用连笔、倒笔、简化、繁体、行草等多种不同写法,为电子政务中的实际应用奠定了坚实的基础。
手写输入文字和笔迹保留技术,为真正实现电子政务提供了坚实的基础。现在已经出现的手写批注软件,提供了用笔圈阅、签批电子文档的功能。此外,有的厂商还把手写批注功能模块做成了控件,客户和系统集成商可以应用批注控件便捷地开发出符合中国国情的中文办公自动化系统,而且即便是已经建成的系统,也可以方便地增加手写功能。以手写的方式输入文字,轻松自然,人们再也不为不习惯打字而犯愁了。
通过设身处地考虑到了电子政务的流程和特点,手写技术为电子政务提供了许多人性化的应用。第一个引人注目的功能就是提供了手写方式的圈阅、批注功能。在电子政务中公文流转是一个重要的难题,而公文从起草、修改到各级领导修改、圈阅、发回定稿、发送给相应部门的过程中,相关领导或者责任人对公文的修改是必需而且很频繁的。目前许多OA系统中公文流转过程中的修改是用键盘来进行的,这就带来了很多麻烦,例如批注的位置、时间的先后以及冒名批注等等--用过WORD文档的人都知道电子文档中批注的麻烦。如果我们采用了手写技术,公文修改时就可以避免这些问题。一方面手写直接在原文上进行批注,更符合人们的使用习惯;另一方面各人的手写笔迹都是不相同的,如果有人要冒名签批文档的话就会很容易通过签名鉴别给"揪"出来。当然,手写签批"见字如见面",感觉上也更为亲切,更免除了学拼音、拆字根的麻烦。何乐而不为呢?
手写技术应用于电子政务的另一个重要方面就是验证功能。例如过去的许多OA系统中,如果需要领导签字确认的时候,键盘没法签字,怎么办?就在文档的某个部位贴一个领导个人签章的小图片,这样做麻烦不说,还存在着安全方面的隐患--曾经在一家单位,有人开了一个不大不小的玩笑--把领导签章的图片用软件截下来,然后在OA系统中贴得到处都是,几乎所有文件都成了领导签批的"红头文件",这样的结果只能是领导停止签字。现在采用手写技术的话,领导的签字笔迹是难以模仿的,系统不仅可以判断你签字的真假,还能根据你的手写签字来判断你是哪一个具体的使用者,从而赋予你相应的权限--比如你在手写板上写下你的名字,进入系统,那么一些你不应该看到的文件就会被系统自动屏蔽掉了--因为它已经从你签名的时候就判断出你的身份权限了。
先进OCR,卸去资料包袱
手写技术,可以算是OCR技术(OpticalCharacterRecognition,光学字符识别技术)的一个分支,后者在电子政务方面也是大有作为。
目前电子政务建设过程面临的一个重要问题,就是过去流程中的那些纸媒体的文件、档案、文本在"无纸化办公"时代如何录入计算机。例如各级政府积累的纸媒体材料上面,很多都是主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如邮政编码、统计报表、财务报表、银行票据等等。这几年来我国电子政务方面大力推广的金字工程,在很大程度上要依赖数据信息的输入。
人工录入的缺陷是十分明显的,速度慢、差错率高、成本高。要解决这个困难,OCR技术是个很好的手段。利用OCR技术,我们可以通过扫描仪等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储在计算机的电子文档中,这就解决了人工录入速度慢、差错率高的问题。
电子政务中除了要处理大量的纯文字文本,还经常要处理许多表格、票据、图文混排文件等等。因此,表格和票据的识别技术也得到了越来越广泛的应用。表格(票据)文本处理是文本分析和识别中一个重要的领域,有其独特的任务与方法。按结构定制方式,表格可以分为定制和未定制两类,定制表格是指预先知道表格的结构,在各种专用表格票据识别系统中处理的都是定制表格;未定制表格指不知道表格的实现结构,技术难度有了进一步增加。值得高兴的是,目前国内的中文表格和票据识别技术已经基本成熟并且开始得到应用,一些厂商的表格和票据识别系统已经被公安、海关等政府部门采用。
除了应用最广泛的文本和票据的识别以外,OCR技术还在电子政务的许多其他领域大显身手。比如,在公安系统的电子政务建设中,基于OCR的身份证识别技术可以直接扫描读入身份证信息,上海第一中级人民法院已经采用了基于OCR技术开发的身份证识别系统。此外,在交通管理中的车牌识别、高速公路车辆超速监测、闯红灯自动监测等领域还常常用到电子眼技术。电子眼用摄像技术获取图像信息,这一步骤相当于普通OCR中使用扫描仪获取图像,然后,OCR系统再分析得到车牌号等有用信息,为公安等业务提供有效的支持。目前基于OCR技术开发的电子眼已经在国内不少城市得到了应用,并且随着交通部门信息化程度的提高,电子眼还会得到更加广泛深入的应用。
OCR技术和手写技术已经进入了一个技术成熟,应用丰富的时代。随着电子政务建设的进一步深入,OCR技术和手写技术必将为电子政务提供更加丰富、有力的支持。