山东省地税在国内率先遵循"金税三期"的主导思想,制定了以"省级发票数据集中?quot;为核心的地税发票改革方案,拟建成以计算机网络为依托、发票管理为核心、税控装置为延伸、安全管理为保障、与征管软件统一平台的高效运行的发票税控管理信息系统,在省一级实现对下属各地市税务部门异构数据库的数据统一管理以及业务整合,建立起统一的数据平台。通过数据的汇总、应用之间的整合以及税务部门与其他部门的信息交换,切实改变软件孤立、信息隔离的应用现状,并在此基础上,逐步实现数据分析、数据挖掘等功能,建立征管信息决策分析系统。同时,业务系统也逐渐由税收征管的集中管理向网上报税、网上纳税及其它更多的应用领域拓展。
面临挑战
山东省地税的业务数据分布在市县两级的近200个异构数据库中,其中包括SQL Server 6.5/7.0/2000、Sybase 11.9/12.5和Oracle 9i,只有部分地市实现了市局的数据集中。同时,税务征管系统由多家集成商实现,缺乏统一的数据标准。由于省级集中式发票管理要求发票数据集中在省局,因此与现有征管业务系统难以直接匹配。
虽然征管业务系统集中是一个必然趋势,但是由于系统的复杂性及各地区管理上的差异,不可能在一、两年内建成全省统一的系统,而废弃现有的上百个业务系统。一、二期中的系统不一致,软硬件和网络条件等不均衡,在集中模式中又不能全部推倒重来,只能在现有基础上改造。 对山东省地税来说,省集中的发票系统与分布在市县的各个征管业务系统之间如何合理衔接是一个必须要面对的问题。另外,该系统涉及与近200个数据库的整合,考虑到不同地区技术人员的差异性,统一的管理和实施无疑也是一项巨大的挑战。
于是,如何选择一个统一的信息平台,并结合山东省地税的现状采用先进的信息技术,提高项目进度,同时降低实施及管理的复杂性和风险,都成为衡量解决方案的重要标准。
解决方案
基于对金税三期思想的理解,并立足于自身的实际需求和IT现状,山东省地税提出分阶段建立一个高度统一和集成的系统,避免一、二期那种系统单一、各地分散建设的局面。 由于新建的集中式发票管理系统需要与原有税务征管系统之间进行数据交换和实时信息访问,如果采用数据仓库的模式,在实时性和双向操作性方面都难以满足系统要求,而如果采用应用集成的模式,近200个系统的集成其复杂性和工作量都难以在短期内完成。经过比较,山东省地税确定其首要目标是建设一个统一的信息平台。在方案选择过程,客户主要考虑了IBM、Oracle和BEA三家厂商的方案,并根据实际需求,对DB2信息集成器(即DB2 Information Integrator)、Oracle gateway和BEA liquid data进行了POC测试,最终选择了IBM DB2信息集成器作为信息集成的统一平台。
在省局,客户借助DB2信息集成器强大的集成功能,连接相应的各地市业务系统的数据库,并通过联邦技术实现对各地市数据的实时访问。另外,客户还利用其异构数据复制的功能并结合Cross loader的能力,将数据批量抽取到省局数据库中,然后再做进一步处理。
这种模式主要有以下几点优势:
·实施难度小,建效快,管理难度低。采用DB2信息集成器作为信息平台,不要求对原有系统进行变更。无论是联邦还是异构数据复制和Cross loader,都无需在各市县安装新的软件。该平台能够适应现存多种异构数据库的多个版本,包括SQL Server 6.5/7.0/2000、Sybase 11.9/12.5和Oracle 9i。由于采用中心式的统一配置和管理,对基层技术人员的技能要求不高,从而大大降低了管理复杂度和实现难度。
·提供实时数据的访问能力。通过DB2信息集成器,客户能够直接访问不断变化的业务数据库,而且能从一个接口同时访问多个数据库,以保证返回数据的精确性。更重要的是,所有工作都已在后端架构好,并不涉及到原有系统的改动。
·减少IT投入,并提高投资回报率。DB2信息集成器不仅能实现虚拟的逻辑数据集中,同时还提供强大的物理数据集中能力。客户能够从容地规划阶段性的物理数据集中,根据业务需求的紧迫性决定什么数据抽取到省局,什么数据直接访问地市的数据源,从而在系统架构方面提供优异的灵活性。同时,它还能充分发挥现有应用系统和网络的作用,降低初期硬件投资的需求。
·采用DB2信息集成器作为信息基础平台,使得省局不仅能够得到关系型数据库中的信息,更为重要的是,还能够从Web Services、XML文档等其它数据源中获取相应的信息。采用DB2信息集成器,能够极大提高信息平台的可扩展性,这对于税务系统与银行等其他外部系统的连接,无疑具有前瞻性的指导意义。 下图为山东省地税所采用的系统架构。由于市县一级的数据库众多,而且大多为SQL Server数据库,因此在系统架构上采用了两层信息集成的结构:对Sybase和Oracle数据源,直接集成到p650上的DB2信息集成器中;对SQL Server的数据源,则首先通过省局基于Windows 2000平台的DB2信息集成器进行集成,然后再进一步集成到p650上。
在集成策略上,该项目采用虚拟逻辑集中与数据物理集中相结合的方式:对于数据量大而访问频度较低的数据,主要通过联邦技术实现虚拟逻辑集中;而对数据量相对较小而访问频度高的数据,则通过结合应用Cross loader技术和异构数据复制技术,实现数据的物理集中和每日的增量数据加载。未来还能以该平台为基础,渐进式地将县市级的系统迁移至此,实现最终的大集中模式。
实施效益
经过第一阶段两个多月的实施,山东省地税已实现了第一阶段的全省发票统一抽奖的目标,并完成了对市县近200个异构数据库的部分数据的集成,建立了部分数据标准,实现了对全省税务数据的实时访问。
其中,数据的物理集中主要借助Cross loader,每天将数据抽取到DB2信息集成器的数据库中。对部分市县的系统,,则通过数据复制的方式进行增量抽取。同时,在省局建立统一的数据标准,对原有多套系统的数据进行相应的转换和清洗。 现在,山东省地税正在考虑第二阶段的实施,包括逐步实现数据分析、数据挖掘等功能,建立征管信息决策分析系统,同时业务系统逐渐由税收征管的集中管理向网上报税、网上纳税及其它更多的应用领域拓展。