APP下载

基于“校园一卡通”的外语成绩分析及引导措施研究

2018-03-27张洋瑞霍光

商情 2018年4期
关键词:特征向量校园一卡通特征值

张洋瑞 霍光

[摘要]随着数字化校园建设的日益深入,一卡通已成为大学生不可或缺的生活必需品,它记录了包括学习、生活、消费等信息在内的海量的学生数据。对这些数据进行挖掘和分析,不但可以有效掌握大学生的在校行为,还能够通过构建行为分析模型对大学生成绩进行预测,为教学部门、学工部门进行差异化教学和管理提供数据支持和决策依据,为教辅部门更好的为学生服务提供改进方向。

[关键词]数字化校园 校园一卡通

随着互联网应用的普及和各高校规模的扩大,各大高校都已经初步建成了包括人事、教学、财务、学工、后勤、招生、一卡通等功能相对完善的数字化管理系统。借助这些系统,学校管理人员能够快捷、高效地对学生的学习与生活进行了解和管理。

作为应用最为广泛的“校园一卡通”系统,大部分高校管理人员仅仅关注了系统所实现的功能,去忽视了系统内部所存储的学生信息数据。事实上,“校园一卡通”是集数据共享、身份认证、金融消费等多项功能于一体的信息集成系统。“一卡通”在为师生提供优质、高效信息化服务的同时,系统自身也积淀了千萬条流水记录,其中包含有图书借阅、上课出勤、食堂消费、体育健身等学生行为记录,透过这些记录学校可以在一定程度上了解和掌握学生在校园内的日常生活与学习行为,以便及时、有效的制定出相应的措施。

一、数据来源和定义

本文的数据来源于数字化校园数据中心中与一卡通信息相关联的多个业务系统。笔者希望利用数据挖掘技术从纷繁复杂的一卡通信息中,找出影响学生成绩的主要因素。如表1所示,前11项为分类指标参数,第12项为预期分类结果。为了简化分类模型的复杂性,本文将专业排名进行了重新定义。按照比例将专业排名前10%定义为“A”;中间80%定义为“B”;后10%定义为“C”。

二、预测模型的建立

(一)主成分分析

将表1中的指标参数转换列向量,该向量由12个特征组成,用xi表示每个学生样本的特征列向量,其表示形式如公式1所不:

即把每个学生样本的特征量看作是一组随机向量,并用KL变换得到正交变换基,对应其中较大的特征值的基底有着相似的形状。主成分分析(PCA)算法利用这些基底的线性组合可以描述、表达和逼近原缺陷图像,具体实现步骤如下:

计算平均值

计算差值分量

求协方差矩阵的特征值和特征向量

协方差矩阵的维数为(m×n)×(m×n),其维数较大,可通过求解MT的特征值和特征向量获得MT的特征值和特征向量。求出ATA的特征值λi及其正交归一化特征向量vi,根据特征值的贡献率选取前p个最大特征向量及其对应的特征向量。累计贡献率φ是保留部分的累计方差在方差总和中所占百分比,也可以将其理解为所选取的主成分与原始数据的相似程度。φ越大表示所保留的成分与原始数据越接近。

本文选取累计贡献率φ>90%,并根据所求出的前p个特征值和特征向量求出原协方差矩阵的特征向量。

由其构成的新的特征向量为:

(二)SVM分类

支持向量机(support Vector Machine,SVM)是1995年由Vapnik提出的,由于其具有诸多优点而得到广泛研究应用和发展。目前SVM技术已经十分成熟,相应的算法软件包得到了学术界的认可,其中最为具代表性的要算台湾大学林智仁教授开发的LibSVM软件包。本文的分类预测也是应用LibSVM软件包实现的,核函数选择的是径向基函数(Radial basis function,RBF),并采用5次交叉验证。

本文实验样本取自英语专业两个平行班级,以一班30名学生的数据作为训练样本构建分类器,用二班28名学术的数据作为测试样本,验证分类预测模型的准确率。

由表2可以看出,分类预测错误大部分在将B类学生误识为A类和将B类误识为c类,另外还有一小部分错误来自于将A类误识为B类。这表明本文所提预测模型对前10%和后10%学生的预测中混入了部分中等生,即在一定程度上扩大了排名靠前和靠后学生的范围。

本文所提方法虽然识别精度不高,但对于高校教学改革和学生管理仍然具有较高的实际应用价值,比如可以将模型预测出的“后10%的学生名单”导入“学位预警系统”,提醒任课教师、学工人员以及学生本人尽早采取改进措施,避免挂科、降级等事件的发生。

三、结论

“校园一卡通”中存储或关联的学生信息,确实能够表征学生的一些特征。对这些数据的挖掘和分析能够在一定程度上按专业成绩排名对学生进行分类预测。为教学部门、学工部门进行差异化教学和管理提供数据支持、决策依据和改进方向,是高校教学改革的有效助力工具。

猜你喜欢

特征向量校园一卡通特征值
高中数学特征值和特征向量解题策略
三个高阶微分方程的解法研究
求矩阵特征值的一个简单方法
浅析高校一卡通系统财务管理
球壳区域上二阶椭圆特征值问题的一种高精度数值逼近
氨基酸序列特征向量提取方法的探讨
基于校园一卡通的学生信用管理模型设计
一类非线性矩阵方程组性质的研究
矩阵方法求一类数列的通项