发布时间:2010-08-13 00:00 信息来源:怀化市统计局
统计数据库是一种用来对统计数据进行存储、统计、分析的数据库系统。现实社会中对国民经济、科学技术、文化教育、国防军事、日常生活的大量调查数据是人类社会活动结果的实际反映,是重要的信息资源。采用数据库技术实现对统计数据的管理,对于充分发挥统计信息的作用具有重大的意义。因此,从国家到基层,各级统计机构都非常重视统计数据库的建设。
统计数据库按其功能可分为专业报表型数据库、数据仓库和对外服务型数据库。专业报表型数据库是针对统计部门的统计报表制度而专门设计的数据库,目的在于高效的集中汇总以及迅速的传输,例如目前我省各级统计系统正广泛使用的EPRAS后台数据库。数据仓库则是将重点定位在存放与管理统计资料,例如人口普查数据库及基本单位普查数据库。而对外服务型数据库是侧重于对对外提供统计资料的共享功能的数据库,例如年鉴数据库。目前,省统计局制订的《“十五”湖南省统计系统信息工程建设规划》中对于统计数据库的建设已经有了一整套的工作部署。因此,我市统计数据库的建设工作应该紧紧围绕“规划”进行,从而确保市本级统计数据库建设顺利推进。
一、我市统计数据库现状
(一)专业报表程序种类繁多,涉及的数据存储形式也是多种多样。目前我局还在使用的本地报表软件有epras、apras、sarp2000、久其通用统计报表软件等多种软件系统。这些软件都带有一个单独的数据库后台,数据库系统涉及到mysql、sql2005、以及vf6.0。其中epras系统在我局各个专业中使用最为广泛,我局8个专业科室中有5个科室的报表要使用到epras系统。
(二)数据量以及数据库量在不断积累增加。一方面随着我市社会经济的不断发展、统计工作的不断深入,统计数据库所存储的数据量也不断增加;另一方面随着统计报表的时效性累积,月度数据需要新建相应的月报数据库用以存储相应的统计报表数据。此外,各类专业普查,也需要有一个相应的数据库用来存储相应的普查数据。目前自EPRAS报表系统投入使用以来保存在计算站服务器上的数据库数量共计79个,包括第二次农业普查数据库,第二次经济普查数据库,以及06年以来各月的月报以及05年来的各年年报数据库。而每个专业都保存着有本专业的全部数据,并且有很大部分数据没有在计算站备份保存。
二、我市统计数据库建设存在的问题
(一)数据库建设缺乏有效的统筹规划。统计数据建设是一个系统工程,好的统筹规划有助于日后的建设过程少走弯路,有利于减少数据录入的工作量,也有利于日后对数据库的扩展和维护。目前看来,即使是省局epras一套表系统推行使用了这么多年,由于各个专业的统计对象,统计指标,以及统计审核方式的不同,我局各个专业数据仍是各自为政,统计数据存放分散,数据整合进程缓慢。而各个专业的报表的数据是一切统计数据库的源头,几乎所有的统计数据库数据都是取自于各个专业的报表型数据库。缺乏有效的统筹规划必将进一步导致专业数据库的混乱加剧,增加以后数据库建设的困难。
(二)数据库设计缺乏统一的规范。统计工作对应的数据众多、统计指标多变、计量单位复杂,在数据库设计之初需要有统一的规范,对指标进行编码要保证数据全面性、不重复性、可操作性、可扩充性及可调查性。目前,我市所有统计数据库都是自上而下的报表型数据库,且各个数据库的数据在规范上仍然有一定区别,大部分的数据库只能做到在本专业内的统一规范,数据复用率低。举个很简单的例子,同样是101表,专业不同数据库内的表式也就不同,导致数据不能复用,在数据库整合的时候就会出现重复数据,增加数据库负担,降低数据库使用效率。如果在我们统计系统内部都不能做到统一规范,那么对于其他部门数据,想要实现相互共享,那就更是难上加难。
(三)数据存放分散,安全存在隐患。正如前面所说,目前各个专业的数据各自为政,数据分散的存放在各个专业人员的计算机之中,而计算站的服务器上保存的各个专业的数据较少,不能对数据进行统一管理及存储。且由于各个专业的统计人员,计算机水平参差不齐,安全防范意识也各有不同,因此,无形中增加了数据存放过程中发生数据损坏事故的几率。再则,统计数据中相当一部分数据属于涉密数据,如果光从加强网络安全建设防止来自统计网络外部的攻击,显然无法有效做到涉密信息不泄露,因为信息泄密也可能来自数据操作人员不经意的过失,而数据的分散存放,同样也增加了涉密数据泄密的可能性。
(四)对外服务型数据库过于简陋,远不能满足统计数据服务需求。统计局是统计信息发布的管理部门,兼负着全市经济社会发展综合统计信息的发布职能。然而,依靠我局现有的对外服务型数据库,无论从内容还是技术、时效层面都远不能满足社会各界日益增长的统计数据查询需求。当前我局对外提供数据查询服务的数据库只有怀化市统计信息网的后台数据库。从内容上看,这一后台数据库在设计之初的主要功能定位是文字类信息发布,因此在数据存储方面是以整篇文章为最小单位整块存放,以文章标题为索引。如果在检索的时候,文章标题若没有切中关键字眼,即便是文章内有大量的文字表述,也是不能够检索到的。从技术上看,由于统计数据是以表格形式进行整体发布的,就像是雕版印刷术中的雕版,众多的统计数据组成了一个不能细分的整体,对于这样一个整体的数据块,数据库不能提供完善的数据检索功能,致使检索数据效率低下;从时效性看,当前数据是以专业投稿或管理员收集等方式进入数据库,入库时间的滞后必然导致了数据的时效性大打折扣。
三、统计数据库建设对策及建议
(一)严格落实省局数据库建设规划。统计数据库的建设是一项投入非常巨大、周期很长的基础工程,建库前要进行仔细的研究、论证。就目前的实际情况来看,省局在数据库建设上已经制订了一个完整的规划,对于数据库标准、类型、规模、载体形式、选用的软件、人员配置等都有了一个整体的统筹规划。在此基础上,我市无需重新拟制、另行规划,只要严格落实省局数据库建设规划,必定能够较好地统一数据结构及数据库框架,并最终消除由于专业数据库混乱带来影响,极大地提高我市的数据库质量,利于数据共享。而对于因自身业务需要自行建立的数据库系统,可统一采用一套表的数据库规范,理由有三:一是技术论证成熟,改造成本小。一套表系统是省局花费大量资源打造的统计报表专用系统,因此其后台数据库在设计之初就已经充分考虑了统计数据众多、指标多变、计量单位复杂等情况,在这么多年的使用过程中,我们对其也是十分熟悉,只需要投入很少的资源加以改造,就能够直接利用。二是推广度高。一套表系统已经深入到我市各级统计机构之中,数据库规范的直接参照使用,便于理解,推广速度必将大大提高。三是兼容性强。一套表系统本身就是统计局的专业报表系统,采用它的数据库规范能都很好实现数据的无缝衔接,不需要再进行额外的数据格式转换。
(二)制定数据库操作规章制度,杜绝安全隐患。主要从统计数据的收集入库和统计数据的入库后存放两个方面入手。一方面是要制定统计数据入库制度,要明确各专业数据何时,以何种方式保存至计算站服务器上的数据库内。另一方面是要制定数据入库存放后的安全操作制度,要明确计算站对服务器内数据的备份频率,备份载体,无用数据的处理方式等防止数据丢失。而对于涉密的统计数据操作,应尽快制定专业人员对涉密数据的安全操作制度,并严格执行,防止因为人员疏忽导致涉密数据泄密事故发生。
(三)围绕月报数据库平台建设,逐步提升统计数据服务质量。如何应用数据库对外提供统计数据服务,这在全省乃至全国现在都是处在不断探索完善的阶段。对于我市来说,要充分认识自身优点和不足之处,立足市情,从小型项目开始,逐步积累数据库建设经验,探索统计数据服务方法,最终形成一套有自己特色的统计数据服务体系。就目前来看,工作可从建立月报数据平台开始逐步实施。这样做是基于以下几个原因:一是目前无论是对统计局内部还是其他部门以及社会公众来说统计月报数据的使用都是十分频繁的,建立这样一个平台可以有效地提高我市统计数据服务水平。二是统计月报的数据指标相比我们各专业的日常报表来说比较简单,建设起来不需要投入过多的资源,容易实现。而建设过程积累的经验,对我局逐步扩建其他统计数据服务平台有莫大的帮助。三是网络基础已经初步具备。对于我们自身统计系统来说,统计内网建设一直是走在其他部门前列的,而更为重要的是,市政府的电子政务内网已经运行过一段时间了,市直各部门已经能够通过电子政务内网进行通信,如果能够建立月报数据库,那么既可以方便我市统计系统对月报数据的查询,也可以方便和市直其他部门的数据衔接以及共享。因此,建设月报数据平台对于我局来说不仅仅是一次对统计数据服务的方式的探索,更是建立我市统计数据服务体系的开端。以此为基础,不断实践,不断完善,逐步发展起来的统计数据服务体系才是真正贴合市情,满足我市统计数据服务需求的特色体系。才能使我局的统计数据服务得到质的飞跃,满足我市社会公众对统计数据的需求。
执笔:杨 钦
责编:米军霞
审签:喻明晃