APP下载

基于关联规则挖掘的学生评教结果分析

2017-07-01李超锋胡鹏

海峡科技与产业 2017年6期
关键词:学生评教关联规则

李超锋++胡鹏

摘 要:利用Apriori算法对1355个课堂的学生评教结果进行了关联规则挖掘。挖掘结果表明学生对具有硕士学位职称为正高级年龄超过46岁的教师的教学效果评价较差,对具有副高级职称年龄在35岁及以下的教师的教学效果评价较好。本文据此提出了相应的教学建议。

关键词:学生评教;教师特征;关联规则

0 引言

随着我国高校信息化水平的不断提高,几乎所有高校的教务管理或教学质量监控部门都引入学生评教系统并开展了学生评教工作,积累了大量的学生评教数据。一些高校的教学管理人员已经意识到了学生评教数据中蕴含着对提高教学质量有用的潜在信息和知识,并逐步着手开展了对学生评教数据的分析与挖掘。其中,将数据挖掘中的关联规则挖掘技术应用到学生评教数据以发现教师背景特征与学生评教得分之间的内在联系是一个研究热点。如周秀梅、李高菊等通过关联分析发现教师的职称和年龄会影响教学效果,教师的学历和性别对评教结果的综合分数无显著影响[1-2]。张美华等通过对300份数据进行关联挖掘发现30-40岁之间具有中级职称的教师容易被学生接受,學生对初级职称教师反映问题较多[3]。杨钧的关联规则挖掘结果表明,专业技术职务为正教授的教师平均得分最高,副教授和讲师平均得分相差不多[4]。张砚雪利用分层次法关联挖掘对教师测评系统数据库中的数据进行分析发现,具有副高职称的教师,学生评价分数很高,助教职称的教师则没有得到学生的认可[5]。

然而,通过对大量的文献分析发现,目前研究人员在使用关联规则挖掘学生评教数据时基本上只考虑了规则的有效性,对规则实用性的关注不够。另外,所使用的数据来自于部分学院甚至个别专业的少量数据,数据的代表性和证明力略显单薄。本文利用Apriori算法对某部属高校学生评教的真实数据进行挖掘,找出高校教师自身特征与学生评教结果之间的关联规则,以期为培养高素质的高校教师队伍进而提升高校教学质量提供实证研究依据。

1 数据来源及预处理

本研究所需要的数据包括学生评教数据和教师自身特征基础数据。学生评教数据来自于某部属高校2014-2015学年度第2学期学生评教数据库中的原始数据,教师自身特征数据来自于该校人事管理系统的基础数据库。

学生评教数据在使用之前进行了数据筛选、课堂评教平均得分计算和离散化、缺失值和异常值去除等预处理,共得到1399个课堂评教数据。其中缺失值是由于部分学生未对所修课程所有评分指标进行评分造成的。异常值包括因学生恶意差评[6]导致总分少于40分的学生数据记录和评教人数少于10人的课堂记录。评教得分离散处理时将全校所有课堂按最终平均得分排名,前三分之一为优等级,中间三分之一为中等级,后三分之一为差等级。

教师自身特征数据经过数据筛选、专业技术职务名称统一和年龄离散化等处理,共得到1490位教师数据。其中原始数据中的教授和正高级统一为正高级职称,副教授和其他副高级统一为副高级职称,讲师和其它中级统一为中级职称,助教和其它初级统一为初级职称。年龄的离散化处理将年龄为36岁以下的教师归为青年教师,36-46岁之间为中年教师,46岁以为老年教师。

最后,将学生评教数据和教师自身特征基础数据按教师工号连接合并。因部分外聘教师信息登记不全,连接后的数据中有44个课堂的教师基本信息存在缺失值,去除后剩余1355条记录为本研究最终使用数据,结构如表1所示。

2 研究方法及工具

关联规则挖掘用于发现数据项之间的密切程度或关系,对于给定的项和事务集,通过对事务集的分析,挖掘出项集中项之间的相关性。挖掘出的结果通常以规则的形式描述,称为关联规则。关联规则的一般表示形式为X→Y。其中X称为规则的前(左)项,可以是一个项或项集。Y称为规则的后(右)项,一般为一个项,表示某种结论或事实。

一般情况下,可以从数据中找到很多关联规则,但并不是所有的关联规则都有效且实用。必须采用一定的测度指标筛选出有效且实用的关联规则,这些规则称为强关联规则。强关联规则常用的测度指标包括支持度(support)、可信度(confidence)和提升度(lift)。

支持度用于测度关联规则应用的普适性,其值为前项与后项同时出现的概率,数学公式如式(1)所示,式中|T|表示事务总数。

可信度用于测度关联规则的准确性,其值为包含前项的事务中同时也包含后项的概率,反映出前项出现的条件下后项出现的可能性,数学公式如式(2)所示,式中|T(X)|表示包含项X的事务数,|T(X∩Y)|表示同时包含项X和项Y的事务数。置信度高说明前项出现时后项出现的可能性高。

置信度和支持度用于测度规则的有效性,即那些具有较高置信度和较高支持度的规则才被认为是有效的规则。实际挖掘过程中,通常需要根据实际情况指定最小支持度和最小可信度。

有效的关联规则并不一定实用。因为这些规则可能揭示的仅仅是一种随机关联关系,也可能揭示的是反向关联关系[7]。因此,在进行关联规则挖掘时不仅要考虑规则的有效性还要考虑规则的实用性。

提升度用于测度规则的实用性,其值为规则置信度与后项支持度之比,数学公式如式(3)所示。

提升度反映了规则前项的出现对规则后项出现的影响程度。有实用价值的规则是那些提升度大于1的规则,因为只有提升度大于1才能说明前项的出现对后项的出现有促进作用。

本研究利用关联规则挖掘的思想挖掘学生评教平均得分等级与教师自身特征之间的强关联规则,其前项为教师自身特征即性别、职称、年龄和最高学位中一项或多项的组合,后项为平均得分等级。研究过程利用R语言中的相关函数实现。

3 挖掘过程及结果分析

采用R语言软件,利用关联规则挖掘技术中的Apriori挖掘算法,对预处理之后的数据进行挖掘。首先在R语言GUI窗口中安装和加载Apriori函数包arules,通过read.table函数将预处理后的数据读入到数据框Data中并转换为Transaction类的实例格式,调用apriori函数进行关联规则挖掘,最后去除冗余规则后利用inspect函数查看挖掘结果。用R语言实现过程如下:

install.packages("arules")#安装相关包

library("arules")#加载相关包

Data<-read.table(file="data.txt",header=TRUE) #读取预处理后数据

Trans<-as(Data,"transactions") #转换为稀疏矩阵式,即Transaction类的实例

Rules <- apriori(Trans,parameter=list(support=0.01,confidence=0.5,minlen=2),

appearance=list(rhs=c("平均得分=差","平均得分=优","平均得分=中"),

default="lhs"))

SuperSetF<-is.subset(Rules,Rules) #冗余规则

inspect(Rules[-which(colSums(SuperSetF)>1)]) #查看去除冗余规则后结果

挖掘过程中最小支持度取1%,最小置信度取50%,最终结果中只选择后项为平均得分等级的规则,结果如表2所示。

表2中3条规则的提升度均大于1,说明3条规则均具有实用性。第一条规则表明学生对具有硕士学位年龄在46岁以上正高级教师的评教结果并不理想。这一方面说明学生在评价教师授课质量时并未受教师职称的影响,另一方面也反映了当前高校教学中的一种现象,即具有正高级职称的教师由于兼职或只重视科研而并未将主要精力投入到教学中去。第2和第3条规则表明年龄在35岁及以下具有副高级职称的青年教师深受学生青睐。通过与部分学生座谈发现主要有以下几个原因:一是这些教师年龄与学生接近,思维方式相差不大,易于被学生接受;二是这些教师基本上都是刚刚博士毕业不久,对本专业的知识掌握程度既有广度又有深度,而且与现实比较贴近,容易引起学生共鸣;三是这些教师信息化教育水平较高,上课过程中善于利用多种教学手段,能够较好地吸引学生的注意力;四是这些教师经过几年的实际教学经历具备了一定的教学经验。

4 结论及建议

本研究共得到两个主要的研究发现:第一,具有硕士学位职称为正高级年龄超过46岁的教师的学生评教结果较差。第二,具有副高级职称年龄在35岁及以下的教师的学生评教结果最好。

基于本研究的发现,我们提出了如下的教学建议。

(1)高校在强调让具有正高级职称的教师必须为本科生上课的同时,还应当通过思想教育和制度设计让这些教师真正愿意投入精力为本科生上好课。

(2)教师教学发展研究中心应有针对性地多开展教师教学培训与交流,对教学效果差的教师深入剖析原因,加强教育与培训,对教学效果好的教学方式和手段大力推广。

(3)组织人事部门应鼓励教师攻读博士学位或进修,进一步提高教师的业务水平。

总之,希望通过本文的研究结果一方面可以为我国高校建立科学的人事管理和决策制度提供依据,指导学校有针对性地加强对教师的教育、培养和培训。另一方面可以帮助高校教师审视自己的教学过程,调动教师的教学积极性,提高教师对教学工作的重视程度和教学有效性。

基金项目:本文系湖北省教学研究项目“基于数据挖掘技术的高校教学质量评价研究”(项目编号:2014191)研究成果之一。

参考文献

[1] 周秀梅,翁家铭,李石君.完全加权正负关联规则算法及其在评教数据中的应用[J].内蒙古师范大学

学报(自然科学汉文版), 2016,45(2):242-248.

[2] 李高菊.數据挖掘在职业院校“学评教”体系中的应用[J].河北软件职业技术学院,2016,18(3):47-50.

[3] 张美华,欧云. 关联规则在高校评教系统中的应用[J].电脑知识与技术,2016,12(1):31-34

[4] 杨钧,马铁明,吴磊,张颖.关联规则在中医院校学生评教系统中应用[J].辽宁中医药大学学报, 2016,18(11):

222-224.

[5] 张砚雪.应用关联规则算法对高校教师测评数据进行分析]J].科技创新导报,2016(1):105,106,108.

[6] 陈磊,倪天倪.学生评教差评教师的有效性研究[J].高教探索,2012(1):84-90.

[7] 薛薇.基于R的统计分析与数据挖掘[M].北京:中国人民大学出版社,2015:323.

猜你喜欢

学生评教关联规则
基于云模型的高校学生评教方法研究
持续改进课程教学质量的一种措施
基于Apriori算法的高校学生成绩数据关联规则挖掘分析
关联规则挖掘Apriori算法的一种改进
基于关联规则的计算机入侵检测方法
高校学生评教有效性分析与策略研究
残疾大学生评教制度效果和问题研究
关于民办高等学校学生评教可靠性的研究