APP下载

大数据挖掘技术在计算机基础课程教学中的应用

2017-07-13李宏艳

教育教学论坛 2017年28期
关键词:计算机基础课程

李宏艳

摘要:应用数据挖掘技术对参加计算机基础课程的学生常规期末考试成绩进行挖掘分析,提取有价值的信息,寻找出教学中存在的问题,并利用粗糙集理论各个条件属性对决策属性影响力的不同,计算出各种题型对考试结果的重要性,进而确定影响学生考试成绩的重要知识点,从而指导教师有重点地研究分析下一步教学活动。应用实践表明,在计算机基础课程的常规考试中,利用大数据粗糙集理论属性重要性来分析判断学生所学的不同知识点对成绩影响的程度,结果与实际情况是吻合的。

关键词:大数据挖掘;粗糙集理论;计算机基础课程

中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2017)28-0272-02

计算机基础课程是高校学生学习计算机的入门课程,不管是计算机专业的学生还是非计算机专业学生都是必须学的,也是必须掌握的计算机技术。本文尝试在计算机基础课程的教学中应用大数据挖掘技术,运用粗糙理论、模糊理论、数理统计作为理论基础,以事实数据作为理论基础进行分析研究,对学生掌握的基础理论知识以及理解程度有一个准确的了解和掌握,从而为计算机专业的讲师开展计算机教学提供可靠的事实与数据理论依据。

一、大数据及挖掘技术相关的概念

大数据(big data,mega data),顾名思义就是很大的数据,或称海量数据、巨量资料,具有Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值),又称为4V特点。

数据挖掘技术则是从海量的、不完全的、随机的、模糊的数据中,提取人们事先不知道并且是隐藏的数据中的,研究分析的有用信息和知识为我所用,为将来所用。如何对庞大的、海量的、复杂的、不完全、不完整的大数据进行统计分析、推理,发现数据之间隐藏的规律为我所用?如何对大数据这个不精确、不完全的知识的表达与分析,这是大数据背景下高校特别是计算机应用专业的教师、学生应该学习的最重要的基础知识,掌握并利用大数据挖掘及其相关技术基础理论知识。

二、大数据挖据技术对计算机教学的指导作用

利用挖掘技术对大数据进行挖掘,可以为国家出台相关政策与决策提供相应的依据,也可为高校教师在教学的过程中提供优秀教学理论与能与时俱进改进教学方法与内容,为知识的更新转化提供一个新的、更好的平台。为以后的定向业务数据学会数据的挖掘。学会准备数据、挖掘数据、分析数据、结果分析、得出结论,为下一步的发展提出指导性意见与建议。

目前大数据挖掘技术的主要方法有大数据数理模型理论、神经网络模型理论、模糊理论以及粗糙集理论算法技术、决策树、三角几何技术等相关数学方法统计分析、归纳等。

(一)利用粗糙集理论对大数据进行挖掘

粗糙集理论是科学家研究不精确、不确定性信息的技术,而目前网络大数据恰恰具有这样的特点,挖掘大数据本身所反映出信息和挖掘隐含的价值信息,不附加信息或经验知识,得出的结论相对说比较客观、真实,更加符合所统计对象的实际情况,对以后决策抑或改变更加有据可依,有据可查。使用粗糙集理论对信息大数据进行挖掘,就是通过对大数据进行分类、合并同类、属性约简、属性归类等必要的压缩,从而找出大数据的规律,找出有价值的信息,预测对象发展趋势,发展变化,从而制订相应的策略方法,降低成本,扩大收益。

(二)举例说明如下

计算机基础课程在学期结束时,学生将参加期末计算机应用能力考试,考试内容共分为七项:第一项是选择题,设分值40分;第二项是网络应用题,设分值为10分;第三项是计算机系统操作,设分值8分;第四项是办公软件应用,四项一分项是Word应用,设分值为18分;四项二分项Excel应用,设分值为14分;四项三分项是Power-Point应用,设分值为10分。

笔者从2015级非计算机应用专业抽取30名同学,来参加一次模拟考试,把模拟考试数据进行了整理,形成了原始考试成绩表如表1所示。

上表中,用S1、S2、…、S6分别表示选择题、网络应用题、计算机系统操作、办公软件Word操作、办公软件Excel操作、办公软件PowerPoint操作,g代表总成绩。

(三)设定标准进行数据分析

我们把学生总成绩按不同分数段进行离散化处理,首先分数百分化,也就是将得分乘以100后除以设置分。把学生得分总成绩按80—100、60—79、0—59分划分为优秀、合格、不及格,设为1、2、3。利用離散化的方法得出下表2。

(四)数据挖掘分析

设C={S1,S2,S3,S4,S5,S6},决策属性D={g},根据粗燥集理论公式决策属性D的重要性公式,分别计算各个条件对决策属性D影响率,结果如下,

SGF(S1,C,D)=0.38,SGF(S2,C,D)=0.08,SGF(S3,C,D)=0,SGF(S4,C,D)=0.13,

SGF(S5,C,D)=0.26,SGF(S6,C,D)=0。通过分析各题在总分中所占比例,以及得分比重,发现本次模拟考试中,影响最大的是选择题,其次是电子表格的操作,再次是word。而系统操作和幻灯片使用对总分的影响很小,可以忽略。分析探讨深层次的原因,是因为选择题涉及的知识点多,又侧重于概念方面,学生在学习的过程没有很好地去理解,导致了失分情况比其他题要多。另外电子表格和文字处理操作则是目前最基础的计算机应用软件,也是教学的重点和难点,电子表格的难点主要在函数的使用以及函数的设计上,这就需要教师在函数使用上多多设计一些题型让学生运用函数或函数组合来解决问题,让学生体会理解函数的用法。幻灯片的操作整体得分较高,相差不大,对考试结果的影响很小。幻灯片软件操作相对简单,而且也是学生最感兴趣的软件,学生对基本操作都掌握得较好。对于操作系统和网络应用技术,由于家庭电脑的普及,在网络概念和操作上没有大的问题,很多学生可以说是无师自通,问题也不大。

对于其他大数据挖掘技术笔者在此不一一举例了,大数据分析方法可以多种多样,但不管运用什么方法,挖掘出数据隐含的价值信息为我所用,特别随着大数据时代的到来,大数据的处理技术是计算机基础课程必须涉及与改革的,这样计算机基础课程教学才能与时俱进。

三、結束语

大数据时代随着互联网和移动互联网发展的脚步已铿锵有力地到来了,并且已经在某些领域影响着我们的生活、学习与工作。高校在教学实践中要与时代发展趋势同行,同时要求高校教师在教学思想、教学理念上迅速做出调整,并制定出最新适合学生今后发展的计算机应用能力培养方案,并且行之有效地付诸实施,做到提高学生的计算机应用以及应变能力,增强就业竞争优势,满足社会对复合型职业技能人才的需要。

参考文献:

[1]刘刚.数据挖掘技术与分类算法研究[D].中国人民解放军信息工程大学,2004.

[2]张颖.数据采掘的研究与应用[D].中国科学院研究生院(计算技术研究所),1999.

Abstract:To analyze the application of data mining technology in computer basic course on students' scores in the final examination of conventional mining,extracting valuable information,to find out the problems in teaching,and using rough set theory to each different condition attributes of decision attribute influence,calculate the importance of various types of test results,and then determine the important knowledge influence of test scores of students,so as to guide teachers to focus on research and analysis of teaching activities in the next step. The practice shows that in conventional computer courses,using a large data attribute importance of rough set theory to analyze and judge the effect of different knowledge of students' scores on the extent of the results tally with the actual situation.

Key words:big data mining;rough set theory;computer basic course

猜你喜欢

计算机基础课程
高校计算机基础课程的“微课程”教学模式研究
高校计算机基础课程新心思路探析
网络时代计算机基础课程教学研究
高职院校计算机基础课程教学改革探究
以专业应用为导向的大学计算机基础课程教学改革研究