APP下载

基于关联规则的大学生体质测试健康数据分析系统设计

2021-08-31

吉林化工学院学报 2021年7期
关键词:数据分析系统数据项关联

朱 春

(芜湖职业技术学院 体育教学部,安徽 芜湖 241003)

关联规则是数据挖掘中所要遵循的重要规则,关联规则以原始资料作为处理对象,在高频项目组的控制下,利用项目组中的高频项建立规则,并结合不同的最小支持度,逐步搜索形成数据项目组[1].关联规则能够使用已知的数据推算出其他与其有关联的数据,并以此为对比标准,构建形成一个科学化的判断过程[2].

在计算机技术的参与下,大学生体质测试模式逐渐发展,进而形成一个健康数据分析系统,将学生各项体质测试指标输入该系统后,系统能够以特定的健康数值,生成个体或总体的身体健康分析结果,校方据此调整实际的教学方向,增强大学生的身体素质[3].

在境外,分析大学生体质测试健康数据的研究起步较早,其大多应用了数据挖掘算法后,数据分析系统逐渐向精准化、关联化发展,可高效分析大学生群体的体质健康状况[4-7];而我国,相关数据分析系统起步较晚,文献[8]以学生体质健康测试区块链为研究对象,在"省级-地级-县级"的三级结构下,从矫正利害相关者的关注点出发,从平台架构、应用前景与现实挑战3个向度对学生体质健康测试现状进行分析.文献[9]采用聚类分析法评价医学院校学生体质健康成绩结构特征,揭示学生体质结构特征的内在联系,为医学院校学生体质健康科学训练工作提供理论依据,有助于快速提高体质健康成绩.

综合各国的研究现状来看,设计一种基于关联规则的大学生体质测试健康数据分析系统是很有必要的.因为其在体质测试指标输入后,通过给定的最小置信度,在每个最大频繁项集中寻找置信度不小于设定的最小置信度的关联规则,便于确定数据项数量数值、降低迭代次数、减少实际响应时间.

1 大学生体质测试健康数据分析系统硬件设计

在构建分析系统的硬件层结构时,选择数据采集设备和上位机作为主要组成部分,在获取实际的大学生体质物理量数据后(如身高、体重等),通过传感器将其传输到硬件层.硬件层采用NI Compact RIO机箱作为数据采集核心器件,搭建形成的硬件层结构如图1所示.

在图1所示的硬件层结构下,控制数据采集模块内设置1个FPGA芯片,芯片外部连接1个可拆卸的工业I/O模块后,外部串联1个嵌入式控制器NI cRIO-9075,配置1个4通道的电压输入模块NI9215后,外部串联1个8通道的电流输入模块NI9275.在控制器内形成同步采样电压过程,缓冲处理硬件结构中的模数,形成模数转换器,在模拟输入通道的控制下,在硬件结构内形成一个数据传输通道,实现对大学生体侧数据的传输.

图1 搭建的硬件层结构

设置NI cRIO-9075设备的工作温度范围为40~-30 ℃之间,固定其工作频率为300 MHz后,在设备上放置1个4槽接口并连接1个串行端口.在I/O串口功能的支持下,实现硬件结构的定时功能,设定的工作参数如表1所示.

表1 设定的器件工作参数

在表1所示的器件工作参数下,在硬件层结构外部设定无线WIFI感应器,控制感应器内集成数据信号监听、数据预处理以及数据通信3个模块.数据信号监听模块内部放置一个1GB、支持RAM功能的四核处理器,利用处理器板上的USB端口,外部连接一个LPDDR2 SDRAM作为储存预处理数据的元件,元件外部连接一个微型天线,接收体测过程产生的各项数据.

采用光电传感器( EE-SX1042,深圳中勤拓展实业有限公司)作为数据采集电路的核心,光电传感器将激光束用偏振片遮挡后,串联一个放大器,形成的信号采集电路结构如图2所示.

在图2所示的信号采集电路结构下,以控制电路中的无线传输芯片(NRF24L01)为核心,并在其内部集成晶振和频率合成器.为了控制芯片的发射功率,在频率合成器外部连接一个调制器后,控制芯片的工作电流在10 mA左右,并在芯片上配置1个天线,同时调控相同接收数据频道内的数据信号.在外围电路内设定10个元器件后,控制器件的工作电压为3.3V.通信器件采用单边天线,调控采集电路中产生的电感与电容间的参数值.

图2 设计得到的信号采集电路结构

为了控制硬件电路的功率输出,在信号采集电路外部并联1个桥式电路结构,电路内部设定3个二极管和2个滤波电容.实际控制硬件结构时,通过控制二极管间接控制数据采集电路中的电流大小,形成的桥式电路结构如图3所示.

图3 构建得到的桥式电路结构

在图3所示的桥式电路结构下,当电阻R4输入高电平时,控制Q1接口流入电流,在线圈U-V的控制下,电流流经Q4端口流入到地端,定义上述电流流经过程为正方向.定义VCC为电容C3的充电电源后,将C9电容作为继电器的调和电容.控制电容C8工作时两端充电,将电路中的碰撞滑块直接发射到碰撞铜板上,在RV1接口上调节电压的输出.在上述硬件结构的控制下,设计数据分析系统的软件结构.

2 大学生体质测试健康数据分析系统软件设计

2.1 构建体质测试健康数据关联规则

在构建体质测试健康数据关联规则时,以硬件结构采集得到的初始体质数据作为处理对象[10],设定I={I1,I2,...,Im}是m个测试项目的数据集合,此时体质测试项目为Ik,也就是长度为k的项集.假设数据集合中存在一个健康数据子集T,此时子集在测试集上的映射就可定义为关联性,关联性数量关系可表示为:

(1)

其中,|D|表示事务总数量;σ(Ik∪k)表示存在的健康数据数量.在上述数量关系下,构建健康数据在体质测试数据中出现的概率,数值关系可表示为:

(2)

其中,sup_count(Ik∪k)表示包含数据长度的事件,sup_count(k)表示含有健康数据的体测事物数.根据上述计算公式,概率值可以反映大学生体质测试健康数据在总数据集中的比例.当概率数据值较大时,可作为健康数据之间相互规则的最小置信度.以最小置信度为筛选准则,对数据中的数据项进行反复筛选,然后对健康数据进行检验.将健康数据不断集成到一个健康数据集中,设置身体素质情况判断的体质测试指标,逐步提取满足要求的规则,作为健康数据的筛选规则.如图4所示.

图4 体质测试健康数据间的对应关系示意图

图4中,构造关联规则后,对体质测试数据输出的关联结果进行分类,形成健康数据测试组,将其分为训练数据组和验证数据组.在数据比例的控制下,构建数据训练模型,对项目的预测数据进行测量,并按照过程构建实际的健康函数[11].为了控制评价形成的分类函数精度,采用二元模型将算法模型、计算出的数据划分为不同类型的数据,在确保都是真实类数据的情况下,即可保证数据训练模型的实际精度满足要求.

2.2 数据分析功能模块化

大学生体质测试数据的种类较为复杂,所以在实现其数据分析功能时,将其划分为登录模块、数据管理模块、数据分析模块以及数据回调模块等.在JAVA语言工具的帮助下,用户登录模块设定用户账号以及用户密码,当密码与账号间符合设定的代码逻辑关系时,开放数据分析系统内部设定的权限[12].数据管理模块的主要功能是更新或更正大学生个人信息和体质测试数据,按照当前大学生体质测试项目名称作为数据管理批次.数据分析模块主要对分析系统硬件中的健康数据进行采集、压缩和存储,方便高校对大学生体质数据进行调用与分析[13].数据回调模块以构建的分析模块作为基础.具体实现过程如下:

第1步,在上述所示的模块划分下,据实际测试的大学生体质数据选择健康数据值,建立相同测试批次的数据分析任务,同时配合学生自身体质参数,一定程度上增加或是删除操作[14].根据设定的关联规则,在线分析体质测试数据在健康标准中所处的位置,计算得到体测数据项的流形程度,计算公式可表示为:

(3)

其中,Lift(k⟹T)表示体测数据在健康数据关联关系中形成的提升度,在提升度数值的控制下,方便体育教师对学生的体测数据进行体质健康数据分析.

第2步,进入健康数据分析模块后,选择不同种类的体质测试通道,采集获取得到大学生体质测试数据,控制此时对数据信号的压缩以及分析,使用压缩处理后的信号进行数据回调分析,同时实现体测数据的在线健康分析过程.

第3步,在数据信号的获取过程中,选定数据分析模块的回调功能时,要压缩实际获取的体质数据信号,并结合实际的数据分析要求,生成实际所需的健康数据分析规则[15],实现对大学生体质测试健康数据的分析.

综合上述软、硬件的设计,最终完成对基于关联规则的大学生体质测试健康数据分析系统的设计.

3 仿真实验

3.1 实验准备

为测试数据分析系统的性能,采用文献资料法、数理统计法和比较分析法,全面了解某大学学生体质健康现状[16].以该学校期末工作总结报告中提供的学生体质健康状况量化数据为数据样本,设定其为采集得到的大学生体质测试健康数据集,采集得到的数据集结果如表2所示.

表2 实验采集得到的数据集

使用表2准备的实验数据集下,使用文献[3]、[8]中以及设计的分析系统进行实验,对比3种数据分析系统的性能.

3.2 结果及分析

在上述实验准备下,控制3种数据分析系统在相同的时间段处理准备的大学生体质健康数据,以时间段内可处理的数据峰值作为统计目标,将10组数据集作为处理对象,最终3种数据分析系统分析数据的峰值结果如表3所示.

表3 3种数据分析系统可处理的最大数据量结果

根据表3所示的最大数据量结果可知,在相同的实验环境下控制3种数据分析系统同时处理相同数据集,文献[3]中数据分析系统可处理的最大数据量在300项左右,实际可处理的数据项数量较少;文献[8]中的数据分析系统可处理的最大数据量在与实验准备的数据量少50项,可处理的最大数据量较大;而设计的数据分析系统几乎能够处理实验准备的所有体质测试数据项,数据处理能力最强.

保持上述实验环境不变,控制3种数据分析系统采集数据的频率为500 Hz,将实验数据集中的数据项作为数据分析中的最小网(mm),统计在不同采样速度下,3种数据分析系统能分辨数据项的个数,实验结果如表4所示.

表4 3种数据分析系统分辨数据项结果

在3种数据分析系统控制下,将实验数据集中的数据项视为不同的数据网格.根据表中数值,文献[3]中数据分析系统可分辨的数据项在20项左右,可分辨健康数据项的数量最多;文献[8]中的数据分析系统可分辨的数据项要少于实际健康数据5项左右,实际可分辨的健康数据集数量较多;设计的数据分析系统可分辨的数据项数量与实际的健康数据项数值相等,可分辨的数据项数量最多.这是因为本文应用关联规则算法,最高精准度地确定了数据项数量数值,为响应时间的减少奠定基础.

保持上述实验环境不变,设定数据分析系统内的功能项,设定观测的操作项名称如表5所示.

在表5设定的操作下,控制3种数据分析系统处理表中的操作,定义操作在数据分析系统中表现与预期效果一致时,表示数据分析系统完成一次数据分析过程.统计并分析不同操作产生的响应时间,并将其作为系统的响应时间,3种数据分析系统的响应时间结果如表6所示.

表5 设定的观测操作项名称

表6 3种数据分析系统对操作的响应时间

控制3种数据分析系统同时处理设定的操作后,根据统计得到的响应时间可知,文献[3]中数据分析系统实际的响应时间在5.5s左右,系统的响应时间最长;文献[8]中的数据分析系统的响应时间在4.2 s左右,系统的响应时间较长;而设计的分析系统对操作的响应时间在1.3 s左右,与两种文献中的数据分析相比,设计得到的数据分析系统的响应时间最短.综合上述系统测试结果可知,与现有数据分析系统相比,设计得到的数据分析系统的性能最佳.这是因为本文方法将整个系统软件部分的数据分析功能模块化处理,根据设定的关联规则,在线分析体质测试数据在健康标准中所处的位置,计算得到体测数据项的流形程度,有针对性地生成实际所需的健康数据分析规则,提高响应时间.

4 结 论

在关联规则的支持下,设计一种大学生体质测试健康数据分析系统,在硬件优化的基础上,将大学生体质测试健康数据分析系统划分为登录模块、数据管理模块、数据分析模块以及数据回调模块等.根据设定的关联规则,以最小置信度为筛选准则,对数据中的数据项进行反复筛选,设置身体素质情况判断的体质测试指标,在线分析体质测试数据在健康标准中所处的位置,有针对性地生成实际所需的健康数据分析规则,确定了数据项数量数值,能够改善现有数据分析系统响应时间过长的问题,为今后判断大学生体测数据健康状态提供一定的理论参考.

猜你喜欢

数据分析系统数据项关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
一种多功能抽签选择器软件系统设计与实现
非完整数据库Skyline-join查询*
利用GSM-R接口数据分析系统偏移的方法研究
“一带一路”递进,关联民生更紧
基于Python的Asterix Cat 021数据格式解析分析与实现
焊接设备实时监测与数据分析系统在核电建造行业的应用
基于信息融合的社群金融信息数据分析系统的研究与实现
奇趣搭配
智能数据分析系统研究及应用