APP下载

“金保工程”部分数据建模挖掘升迁及其存在的问题

2012-08-15□文/江

合作经济与科技 2012年19期
关键词:达州市单位人员

□文/江 忠 余 波

(1.达州职业技术学院;2.达州市科学技术情报所 四川·达州)

一、“金保工程”的内涵及意义

“金保工程”是指利用先进的信息技术,以集中管理的数据中心为基础,以覆盖全国、联通城乡的信息网络为依托,支持人力资源社会保障业务经办、公共服务、基金监管和宏观决策等核心应用,安全、高效、全国统一的人力资源和社会保障电子政务工程。“金保工程”的建设目标是,以全面提高人力资源社会保障行政能力和服务社会的水平为目标,紧密围绕人力资源和社会保障事业的重点工作和发展方向,构建统一、高效、安全的信息系统应用支撑平台,实现各项业务领域之间、各地区之间的信息共享、业务协同和有效衔接,形成统一规范的信息化公共服务体系和科学有效的决策支持体系,实现社会保障一卡通。

机关事业单位保险(以后简称“机保”)是“金保工程”中社会保险的一个重要方面,机关事业单位保险、社会保险、农村保险、就业保险是目前“金保工程”的重点,机保开展的时间早,类型多样,特殊情况较多,数据之间的关系紧密,所以机保数据的收集、分类、挖掘、升级就显得复杂度高。本文以四川省达州市的机保数据为例,进行初步研究。

二、四川省达州市机保数据的建模、挖掘

达州市“金保工程”的实施在四川省地市级中开展得较早,属于试点单位。达州市市级机保单位分为公务员单位、参照公务员管理的事业单位、全额管理财政拨款事业单位、差额拨款事业单位、自收自支管理的事业单位、省中央管理事业单位,达300家,参保人员逾3万,有退休、离休、退职、在职人员的区别,门类众多,情况特殊,以单位、个人上缴的基数比例就要以时间、单位或个人不同进行分类。另外,单位人员的流动性使数据之间的关系变得复杂,有的人从统筹范围外流动到统筹范围内,有的是在统筹范围内的流动,并且有的单位历史变迁频繁,使数据的抽象建模变得困难。

为了能够尽快网络上办公,用Microsoft Project2007制作好达州市机保数据工程项目的甘特图,从技术分析发现数据的收集整理是关键路径上的活动,影响整个工期的控制性节点,通过反复研究确定用二维关系图来描述组织这些大量数据,用Office Excel表来实现对历史数据的收集分类加工,这些表中要确定关键段。共设计了六个表来完成养老数据的收集、整理。养老数据导入顺序:参保单位信息导入->参保人员信息导入->养老缴费历史导入->养老账户导入。即在整个基础数据导入过程中,应先将参保单位信息导入系统,然后再导入参保人员信息,在参保人员信息全部导入系统之后,再导入参保人员的缴费历史和养老账户信息。这六个表分别为:

表一:实现对单位信息的收集,其关键字段为单位编号、单位名称、所属经办机构、组织机构代码、单位全称、单位性质、经济类型、经济类型明细、法定代表人证件类型、法定代表人证件编号。

表二:实现对参保人员个人信息的收集,其关键字段为单位编号、单位名称、个人编号、姓名、身份证号码、性别、出生日期、民族、联系电话、通讯地址、邮政编码、参加工作日期、参保人员类别、增减年月、变更原因、缴费基数、是否参保养老险种、养老参保日期、养老缴费人员类别、建立个人账户日期。

表三:实现对市级机保1998年1月1日以前信息的收集,其关键字段为单位编号、单位名称、个人编号、身份证号码、姓名、险种标志、起始年月、终止年月、发生日期、申报类别、缴费历史类别、月缴费基数、单位缴费比例、个人缴费比例、单位月缴费额、个人月缴费额、单位总缴费额、个人总缴费额。

表四:实现1998年1月1日迄今的数据收集,其关键字段为单位编号、单位名称、个人编号、身份证号码、姓名、缴费年月起始、缴费年月截至、发生日期、申报类别、月缴费基数、单位月缴费额、单位记账比例、单位记账额、个人月缴费额、个人记账比例、个人记账额。

表五:实现对离退休(职)人员的信息收集,其关键字段为单位编号、单位名称、个人编号、姓名、身份证号码、性别、出生日期、档案出生日期、参加工作日期、离退休类别、离退休日期、待遇享受开始年月、代发机构(发放银行)、银行户名、个人银行账号、离退休金、各项补贴合计、基础养老金、过渡性养老金、个人账户养老金。

表六:实现对统筹范围外到本市级机保的转移,其关键字段为转移前单位、转移后单位、开始时间、结束时间、发生时间。

三、“金保工程”机保历史数据系统的升迁

迄今为止,机保管理单位采用养老账户手册作为参保人员的凭证,每年参保数据信息记录在册,作为记载历史信息的依据。这种手工式的凭证一般由参保单位统一保管,容易发生疏忽,并且也不规范,这给管理带来不便。

由于采用手册记账,当人员信息太多时,机保管理单位借助于年末报明年的计划书来把信息注入电脑,因为单位性质、类别不同,机保管理单位要求使用Visual Foxpro6.0和Excel来作为收集数据处理信息的常用软件,所以参保单位每年年末用.DBF格式文件和.XLS电子表格文件向机保局进行报送数据,这样机保局就对这些报送文件进行信息处理,分类存贮、提炼数据。这种方式过分依赖于手工操作,并且是单机操作环境,数据信息没有共享,效率低下,重复性劳动较多。

“金保工程”要以计算机网络、数据库服务器和系统软件平台为基础,支持多种服务管理功能,实现以“数据集中、应用集中、物理集中、安全集中”目标,实现全省甚至全国的统筹。

用大型数据库软件Oracle11.0g作为存取数据的容器,具有数据容量大、安全性高、速度快、稳定性好、便于升级等特点。

系统和客户端用软件Eclipse开发,其优点:从编写、查错、编译、帮助等方面为Java语言贴身定做;可无限扩展的强大插件功能;众多公司、厂商的鼎力支持;开放、自由、免费。

有两种法可完成.dbf文件转换为.xls文件:1、在 Visual Foxpro中,打开包含此.dbf文件的.dbc文件,浏览此.dbf文件,在文件菜单下选择另存为,文件类型选择为.xls类型,文件名自取;2、用EXCEL-数据-导入外部数据的功能来导入EXCEL就行了,只能是EXCEL2007及以上的版本才支持10万行以上的数据。

向oracle数据库导入excel数据文件的方法有:1、oracle的常见第三方工具主要是:toad,PLSQL Developer,object browser;各有优缺点:toad主要是功能强大;PLSQL Developer主要是编译精确;object browser主要操作人性化;2、先将 EXCEL表的数据倒入 Power-Builder9.0(powerbuilder9.0 or higher),然后通过PB与ORACLE连接,用insert into语句导入DB,比较容易实现数据的成批导入;3、在DOS窗口下使用SQL*Loader命令实现数据的输入。

四、“金保工程”实际实施中的一些问题

1、影响工期的“数据字典”设计定义。在实施“金保工程”过程中,进行源代码设计阶段,发现许多的关键字段存在着歧义性和不完整性,这将严重影响后期工程的实施,其原因在于需求分析人员对该系统适用环境研究分析不透彻,对最终用户沟通肤浅,导致工期不可预期的往后延,严重影响“金保工程”的实施。

2、避免频繁手工操作方式,优化操作过程。(1)可以设计数个电子表格,让参保单位自己来输入数据,从而降低难度,减少操作时间,然后再导入现行Oracle系统;(2)单位编号是所在区域的行政代码+自行编号,对成百上千的单位进行编号,需要花大量时间且容易出错,可以把过去的历史数据放在一个用英文命名的目录下,用DOS命令输入:dir/b/a:d>>list.txt或 dir/b>>list.txt,然后,再用 excel命令数据通信->导入外部数据->导入数据->导入文本文件list.txt,再利用excel自动填充功能实现自动编号,达到事半功倍的效果。

五、结语

历史数据存在大量信息,如何使过去凭证式账单变为网络一站式办公“一卡通”,关键在于数据的挖掘,建立科学的数据模型,定义好数据字典,在整个开发环境中显得尤为重要。

[1]刘竹林.Oracle关系数据库实用教程[M].北京:北京师范大学出版社,2007.

[2]刘彤.科技情报与信息技术[M].北京:北京科学技术出版社,2010.

猜你喜欢

达州市单位人员
达州市农村生活污水治理工艺初探
鸣谢单位(排名不分先后)
填单位 要推敲
川东地区义务教育均衡发展研究——以达州市为例
达州市农业龙头企业发展现状调查
看错单位
让刑满释放人员找到家的感觉
协办单位
不得与工会组织任职期内人员解除劳动合同
达州市建成精铸科技有限公司