APP下载

档案信息管理系统中的计算机数据挖掘技术研究

2017-04-27杨小梅

电脑知识与技术 2016年29期
关键词:应用

杨小梅

摘要:文章在阐述计算机数据挖掘技术内涵、方法和基本类型的基础上,分析档案信息管理系统中的计算机数据挖掘技术应用的意义,建构基于计算机数据挖掘技术的档案信息管理模型,探究计算机数据挖掘技术在档案信息管理系统中的应用。

关键词:档案信息管理系统;计算机数据挖掘技术;应用

中图分类号:TP311 文獻标识码:A 文章编号:1009-3044(2016)29-0022-03

在网络计算机逐渐普及的情况下,网络技术和数据库发展日益成熟,对人们的生活生产产生了重要的影响,传统的数据收集整理方式不再适应社会的发展需要。档案信息管理工作是一项复杂化的工作,在管理的过程中需要对大量的数据信息进行筛选、分类,计算机数据挖掘技术在档案信息管理系统中的应用能够提升档案信息管理工作效率,并为档案信息管理工作提供安全的保障,促进档案信息管理的高效发展。为此,文章对计算机数据挖掘技术在档案信息管理系统中的应用进行分析。

1计算机数据挖掘技术概述

1.1内涵

计算机数据挖掘技术是一种新型的数据处理技术,主要是从大数据中的模糊记忆随机数据中选择符合人们需要数据的过程。计算机数据挖掘是一个不断循环的过程,如果一个目标的实现没有达到预计的效果,计算机数据挖掘信息处理系统会重新返回到上一个目标点进行重新工作。通过对目标任务的不断细化处理来满足人们生活、学习以及社会生产信息的需要。

1.2方法

1)关联分析法

关联分析法是指从特定的数据中挖掘出比较频繁的项集模式知识。比如在商场中可以通过计算机数据挖掘技术中的关联分析法了解哪一种商品得到消费者的喜爱(购买频率高)。

2)序列模式分析法

序列模式分析法是指根据数据得出信息之间的联系,在具体操作上侧重对数据模式的基本分析,通过对数据模式的分析最终发展数据之间的潜在关联。

3)分类分析法

分类分析法是指从大量数据中找到一组具有数据典型特征的模型,从而实现对未知数据的分类识别处理。

4)聚类分析法

聚类分析法是指在特定的数据中找到数据之间的联系。比如在商业发展中,商家可以应用聚类分析法对消费者进行分组,找到消费者的购买模式并进行分析,指定符合消费者需要的营销方案。

1.3基本类型

在计算机数据挖掘技术中,根据数据采集信息的质量和特性具体可以分为不同的类型,能够对计算机数据挖掘的范围、属性、应用计算模式、生成训练集合等过程进行详细分析。第一,相关规则。计算机数据挖掘技术中应用的是技术水平较低、操作相对简单的关联性分析原则。通过应用关联性分析原则能够对数据信息进行详细的分析,对同样信息内容的资料进行归纳,找到事物之间的联系,以数据记录的方式,在最大程度上减少因为数据增加带来的计算机系统空间占有率高问题。第二,粗糙集。粗糙集是一种知识模糊的教学工作。粗糙集在计算机数据挖掘技术中的应用能够在无法掌握信息的情况下,通过简单的算法将用户的工作变得简单。另外,粗糙集能够节省用户对数据库研究、对数据资料表格化处理的实践,提升对有关信息的查询、检索、应用效率。

2计算机数据挖掘技术在档案管理系统中的应用意义

2.1提升档案信息管理的安全

档案信息往往会记录非常重要的资料,且资料的信息能够完好无损保留的时间越长,资料本身的历史价值就越高,具有重要价值意义。这些具有高历史价值的档案资料也会得到更多的人使用,在使用的过程中会在不同程度上破坏档案信息的科学、完整,由此也加重了档案信息的管理难度。另外,档案的保密性也是其重要的工作内容,因为档案信息的泄漏会对有关人员的隐私安全带来侵犯。将计算机数据挖掘技术应用到档案管理中能够在最大程度上避免档案信息管理问题的出现,加强档案信息的安全。

2.2提高档案信息管理的效率

计算机数据挖掘技术的应用是对传统档案管理模式的一种补充,能够提升档案管理工作人员的工作效率。档案管理工作中的一个重要工作环节是对档案的鉴定,传统的档案鉴定是由档案管理人员依靠自己的主观经验完成的,受强烈主观因素的影响很容易导致有价值档案信息的丢失。在应用了计算机数据挖掘技术之后,档案管理人员能够利用计算机系统对档案信息的使用和保存情况进行系统化分析,形成档案信息管理规律,促进档案管理工作的稳定进行。

2.3提升档案信息的使用效率

档案信息具有一定的私密性,因而档案信息的借阅范围是有限制的,但由于档案管理人员和使用人们对档案的认知水平不高,导致档案管理部门对档案信息的借阅管理处于一种被动,在人提出借阅申请之后,档案管理人员才会将档案信息提供给需要的人。在应用了计算机数据挖掘技术之后,档案管理人员能够和档案借阅者进行及时的沟通,发现档案借阅者对档案信息的需求以及档案节约的方向,进而形成专门化的档案信息提供渠道,为档案借阅者提供有针对性的档案信息,帮助档案借阅者解决自己的难题。

2.4增强档案信息的服务型

档案信息经过加密处理之后的适用范围会缩小,在信息化快速发展的情况下,很多档案信息自身会呈现出一些问题。但是受传统档案管理思想的影响以及档案管理过程中干扰因素的影响,使得现阶段的档案信息仍是为小部分的人提供服务。将计算机数据挖掘技术应用到档案信息服务管理中,能够对档案的使用情况进行分析,通过分析发现潜在的档案信息使用者和档案信息的未来使用者,进而在对档案数据信息分析和收集的情况下进一步提升档案信息的服务性。

3基于计算机数据挖掘技术的档案信息管理模型

3.1数据筹备工作

档案信息管理的过程中会出现各种形式的信息,比如档案的编号、档案存放地点的相关信息、档案使用信息、档案检索产生的信息、档案访问所产生的信息、档案借阅历史信息等。在档案信息管理系统建立成功之后,系统使用者需要进行注册,在注册成功之后会频繁地应用档案信息管理系统,由此会出现大量的序列数据信息,比如档案的检索数据、档案的浏览数据、档案的借阅数据等。这些数据之间存在一些有价值、有意义的信息。信息化档案管理需要以和档案有关的信息为主要管理对象,做好数据的准备工作。在一切准备好之后将数据存储到指定的数据库中,为之后的计算机数据挖掘工作做好充分的准备。

3.2对前期准备好的数据信息进行预处理

对前期准备好的工作进行预处理可以应用数据清理较为容易忽略的元祖、人工填写方式对纸质档案明细进行分类,从而实现对对应档案专业的统一管理,为之后的档案信息分类管理提供重要的保障。根据最新区域的行政名称,一些地区受区域名稱调整的影响会取消相应的机关信息,针对这种状况,可以应用手工记账填写的方式来进行更正,保证数据前后信息的一致。

3.3应用数据挖掘技术对数据库中的数据进行识别和应用

档案管理人员可以应用数据预处理中的数据清理、数据集成、数据变换等分层技术实现对存储到数据库中的数据挖掘技术进行识别和应用。档案信息管理数据库中会存储使用者的个人信息,在经过数据预处理之后,能够对获得的数据信息进行清洗、修正、减少系统中的错误数据信息,达到对数据的规范使用。档案数据使用者将有关的信息存储到数据库中的时候,数据挖掘程序会对使用者的个人信息进行更新和重新验证,并根据之前的预设值情况对信息重新分类处理,为档案使用者提供具有针对性的服务,保证使用者能够获得自己需要的信息。另外,在档案信息管理系统数据库中信息不断增加的情况下,有关人员可以应用计算机数据挖掘技术对和档案相关的专业进行分析,完善对学科专业的就业分析。

4计算机数据挖掘技术在档案管理中的应用

4.1计算机数据挖掘技术在档案分类管理中的应用

档案管理的基础工作之一是档案分类。计算机数据挖掘技术中的决策树算法能够按照一定的规则将不同类别、不同属性的档案信息在最短的时间内进行区分,并按照档案整理规则将档案进行归类整理,提升档案管理的归类速度、检索速度。应用计算机数据挖掘技术对档案进行分类管理的工作流程具体表现为:从众多的、不同类型的、不同特征的数据集中挑选中一些数据组合形成训练集(已经完成档案数据分类工作的数据集),数据集的构建符合分类模型的构建要求,在构建好训练集之后将其应用在没有完成分类工作的档案管理中,从而帮助档案管理者根据档案信息用户对档案信息的需求来进行档案分类总结,同时还可以根据用户的喜好为其推荐其他档案数据信息。通过这些具有针对性的档案数据挖掘分析能够提升用户获取数据信息的时间,实现对档案数据信息的高效利用,充分发挥出档案数据的价值。比如档案管理人员可以对档案使用者访问的网页内容、档案信息查询的间隔时间、档案信息查询的停留时间、档案信息的下载情况等信息进行科学、系统的分析和汇总,之后根据数据分析对档案使用者的兴趣、爱好进行总结,挖掘档案使用者的其他信息,比如档案使用者喜欢针对档案的内容提出问题等。通过对不同档案使用者的具体特点和档案喜好进行差异化分析,能够进一步提升档案使用者对档案信息的有效使用,提升档案信息服务质量。

4.2计算机数据挖掘技术在档案收集管理中的应用

计算机数据挖掘技术在档案收集管理中的应用主要是根据计算机数据库内部的数据信息描述来构建相应的数据模型。之后将计算机数据样本和数据模型进行对比发现二者之间的差异,如果计算机数据样本和数据模型之间相吻合,需要档案管理人员根据测试样本模型分类方式来对档案信息进行分类处理。档案收集管理中对计算机数据挖掘技术的应用要求是要对档案数据信息库进行全面的分析和测评,从而得到科学的档案收集方案。计算机数据挖掘技术在档案收集管理中的应用需要对档案库中的数据进行分析,经过分析建立专门的对已知数据详细描述的概念模型,将这个模型和测试样本比较。如果其中的一个模型在测试后被认可,则是可以应用这个模型来对档案收集分类管理。比如当档案管理工作人员针对某一件事向客户发放调查问卷的时候,会利用计算机数据挖掘技术将客户的回答输入到数据库中。在这个数据库中,档案管理人员可以借助系统对客户的回答内容从多个具体属性来进行描述,比如客户的年龄、职业等。在有新的客户回答被输入到数据库时,系统会对客户的需求进行分类。

比如:一个学校图书馆让读者在阅读图书实现进行个人信息的登记。图书馆档案管理工作人员对1000名读者阅读历史、经济、科技、时政的情况进行了分析,具体分析内容如表一所示。从表1中可以发现,文科学生比较喜欢阅读历史和时事政治方面的书籍;理科生则是喜欢阅读科技和经济方面的书。通过以上的分析,图书馆档案管理人员能够根据不同用户的不同阅读需求为其提供具有针对性的借阅服务。

4.3计算机数据挖掘技术在档案保留管理中的应用

档案保留法主要是指应用传统的档案管理手段来保留档案信息,使得档案信息不流失的过程。对于企业的发展来讲,留住老员工在某种程度上就是为企业的发展节省成本费用。为此,企业留住老员工所采取的一项重要措施就是对找到老员工档案流失的原因,并应用计算机数据挖掘技术来对老员工档案流失的情况进行细致的分析,根据分析结果采用相应的解决办法,从而避免企业老员工档案的流失。

5结束语

综上所诉,在社会科技的不断发展下,计算机数据挖掘技术的发展和应用是一种必然,将其应用在档案信息管理中能够提高档案管理的效率,实现档案管理的高效发展。为此,在对档案信息的存储、挖掘和利用上在保证基本的信息查询服务之外,还需要随着信息化在档案管理中的推进,利用计算机数据挖掘技术来对档案数据信息进行整合,在大量的档案管理服务数据中建立数据间的关联,从而为档案管理更好地服务。

猜你喜欢

应用
多媒体技术在小学语文教学中的应用研究
微课的翻转课堂在英语教学中的应用研究