APP下载

基于改进神经网络的挖掘算法设计

2018-07-27黄文锋

现代电子技术 2018年14期
关键词:可行性分析粗糙集数据挖掘

黄文锋

摘 要: 针对传统的数据挖掘算法存在结构复杂、耗时长、数据分析过程中易出现错误,数据计算结果难以准确表达结果等缺陷,提出结合神经网络在数据挖掘中的应用方法。由于神经网络拥有对噪声数据承受能力高、错误率低等优点,因此结合神经网络系统对数据挖掘算法进行改进设计可大幅度提高数据准确性,该方法拥有结构简单、表述清晰、精准度高等优势。为基于神经网络的数据挖掘算法的可行性进行了严谨的实验分析,对实验数据进行认真的记录和研究,实验结果表明,基于神经网络的挖掘算法相比传统数据挖掘算法,其精度明显提高,且整个过程耗时较短,由此可证实基于神经网络的数据挖掘算法具有更高的实用性。

关键词: 数据挖掘; 神经网络; 粗糙集; 数据挖掘算法; 数据计算; 可行性分析

中图分类号: TN711?34; TP183 文献标识码: A 文章编号: 1004?373X(2018)14?0143?04

Design of mining algorithm based on improved neural network

HUANG Wenfeng

(Henan Provincial Institute of Scientific & Technical Information, Zhengzhou 450003, China)

Abstract: In allusion to the shortcomings existing in the traditional data mining algorithm for its complex structure, long time consumption, error easily appearing in data analysis process, and difficulty in accurate result expression of data calculation results, an application method of combining neural network in data mining is put forward. As the neural network has the advantages of strong ability to withstand noise data, and low error rate, improvement design of the data mining algorithm by combining with the neural network system can greatly improve the data accuracy. This method has the advantages of simple structure, clear expression, high precision and so on. A rigorous experiment analysis for the feasibility of the data mining algorithm based on neural network is performed on the basis of the recorded experimental data. The experimental results show that the mining algorithm based on neural network has higher accuracy and shorter time consumption than the traditional data mining algorithm, which can confirm that the data mining algorithm based on neural network is more practical.

Keywords: data mining; neural network; rough set; data mining algorithm; data calculation; feasibility analysis0 引 言

数据挖掘算法是从数据库的数据中提取隐含有用信息的过程。现阶段常用的数据挖掘算法和理论主要集中于粗糙集理论和遗传算法等相结合的方式[1]。为了解决传统方法结构复杂、耗时长、错误率高等问题,提出改进神经网络的数据挖掘算法。首先对神经网络进行优化和改进,以便减少误差,然后基于改进后的神经网络设计数据挖掘算法。该算法拥有鲁棒性强、精准度高、抗噪能力强、数据承受能力高、错误率低等优势,可广泛应用于机器学习等领域[2]。通过仿真实验对神经网络挖掘算法的功能进行验证发现其对数据的搜索能力强大、擅长全局搜索,且对数据挖掘的准确性和实时性相对较高,可成功解决传统方法中的诸多缺陷,具有较高的使用价值。

1 神经网络算法优化设计

结合神经网络自身特点以及遗传算法的优势对神经网络进行优化[3]。本文默认网络结构为拓扑结构,主要便于对隐层数及节点数进行计算。由于人工干预常常会对网络隐层数及节点数造成一定破坏,难以对其进行准确测量和计算,考虑通过遗传算法对其进行优化从而避免人工干预次数[4]。

首先,对初始化网络结构进行验证和确定,然后利用遗传算法迭代产生权值优化解[5]。设P为初始权值,按照遗传算法对网络隐层数进行计算,在得到结果后进一步观察,若网络节点数大概满足:

[Pli→0?Pli→0, i=1,2,…,n;l=1,2,…,m] (1)

則可以考虑将网络节点删除。重新用遗传算法产生的权值进行训练,如果达到了满意的结果,那么证明该算法有效,从而优化了网络结构[6]。为了避免网络优化过程中出现误差影响优化结构,采用均方根误差函数对系统进行验证,计算方法如下:

[G(P)=i=1y(xy-P0)f] (2)

式中:G均方根误差;xy表示在y隐层上的节点数为x;

f为适应度函数值[7]。通过上述算法将误差范围缩小到最少,并通过反复计算直至误差为零。由于引入了验证集导致验证集和训练集在可视化显示方面存在较大差别,因此要在结合遗传算法的神经网络中设置优化初始权值和训练网络,以促进可视化显示达到最优解的效果[8]。遗传算法的全局搜索性会导致在以梯度下降法为基准的网络训练过程中,误差在初始阶段很快且与最优解方向出现较大偏差,所以训练的开始一段时间的圆圈处误差下降很慢,为摆脱误差情况要引入极小动量项并且逐步调整搜索方向不断在方向上与最优解方向更靠拢[9]。

2 基于改进神经网络方法的数据挖掘平台设计

基于改进神经网络的数据挖掘系统平台强调数据挖掘算法过程中对神经网络应用[10]。除了对数据重要信息进行挖掘的基本系统功能外,该平台可通过改进后的神经网络实现数据挖掘过程中对数据进行分类和聚类效果,同时可以对处理后的数据进行重复的信息挖掘和检测[11]。用户根据挖掘的结果决定信息是否传输至数据库进行分类保存并对将来的新数据进行分析[12]。图1给出了基于神经网络方法的数据挖掘平台的系统设计图。

由图1可知,基于神经网络方法的数据挖掘平台可为用户提供神经网络方面的数据挖掘服务或上传数据。该系统对信息的挖掘处理方便高效,用户从数据文件或数据库中储存的数据源进行搜索和分析,并通过平台的可视化交互功能对信息挖掘过程进行准确直观的操作[13]。通过不同的神经网络算法对挖掘信息参数进行设置并对挖掘结果评估,最后保存至神经网络模型,以便再次使用。图2展示了建立和保存神经网络模型时序图。

为了方便区分原始信息,图2展示了神经网络模型对信息进行保存和重建体系。通过该系统模型可以清晰命令挖掘用户所需信息并对信息进行保存以便日后使用[14]。对模型中保持的信息进行应用,其方法见图3。

图3所示的挖掘模型可进一步提高信息挖掘性能。在对挖掘结果进行筛选后可将数据上传到数据库或磁盘上,以便今后应用时,服务器可根据用户选择的名称快速查找到其存放的位置并调出模型。为了保障挖掘过程准确快速,建立了基于神经网络的挖掘模块系统,其工作流程如图4所示。

基于神经网络的挖掘模块系统有利于提高挖掘算法的准确性。其拥有结构简单、表述清晰、精准度高等优点,方便对神经网络挖掘数据进行分类和聚类的保存和传送。

3 实验结果分析

将前文提出的基于神经网络算法应用到非线性函数的逼近问题中以验证算法的有效性。采用系统默认参数,对比改良前后神经网络与预期的非线性函数标准迭代次数曲线,得到结果如图5所示。

由图5可见,通过对试验数据进行比对不难发现,在传统神经网络系统中迭代次数曲线与预期标准曲线之间存在较大误差,而文中提出的基于改进神经网络的挖掘技术方法得到的曲线与预期的标准曲线基本一致,可证实该方法中误差基本为零。

为了验证改进神经网络的挖掘算法准确性,进行了2次实验,分别对传统挖掘算法、改良前的神经网络挖掘算法和改良后的挖掘算法精准度进程测量,得到对比结果如图6所示。

根据实验结果进行判断,改进神经网络后的挖掘算法无论从迭代次数还是从挖掘精准度方面均比传统算法及改良前的神经网络挖掘算法有所提高,且耗时相对较少。由此说明了基于改进神经网络的挖掘算法可以避免耗时长、数据分析过程中易出现错误等问题,有较强的可行性。

4 结 语

通过对神经网络进行改进,结合数据挖掘算法可有效提高挖掘算法的精准度,且该方法能够有效解决传统挖掘算法中存在的不足,具有耗时少、精度高等优点。通过仿真实验对该方法进行验证,对比未改进的神经网络处理的数据挖掘结果和传统的挖掘结果,证实改进后的神经网络挖掘算法效果良好、便于操作、适用性强。

参考文献

[1] 王春梅.基于神经网络的数据挖掘算法研究[J].现代电子技术,2017,40(11):111?114.

WANG Chunmei. Research on data mining algorithm based on neural network [J]. Modern electronics technique, 2017, 40(11): 111?114.

[2] 郑斌.基于改进遗传算法的不完整大数据填充挖掘算法[J].微电子学与计算机,2016,33(2):96?99.

ZHENG Bin. Incomplete data filling mining algorithm based on the improved genetic algorithm [J]. Microelectronics & computer, 2016, 33(2): 96?99.

[3] 李滨旭,姚姜虹.基于改进QPSO和RBF神经网络的文本分类方法[J].计算机系统应用,2016,25(7):264?267.

LI Binxu, YAO Jianghong. Document classification based on improved QPSO and RBF neural networks [J]. Computer systems & applications, 2016, 25(7): 264?267.

[4] 张华,王金兰.基于物联网和SOM算法的信息监控系统设计[J].计算机测量与控制,2017,25(4):84?86.

ZHANG Hua, WANG Jilan. Design of information monitoring system based on Internet of Things and SOM algorithm [J]. Computer measurement & control, 2017, 25(4): 84?86.

[5] 田野,张程,毛昕儒,等.运用PCA改进BP神经网络的用电异常行为检测[J].重庆理工大学学报,2017,31(8):125?133.

TIAN Ye, ZHANG Cheng, MAO Xinru, et al. Research on abnormal behavior of power consumption based on BP neural network with PCA [J]. Journal of Chongqing Institute of Technology, 2017, 31(8): 125?133.

[6] 陆安江,金力,杨家红,等.基于改进的BP神经网络在车牌识别中的应用研究[J].贵州大学学报(自然科学版),2015,32(6):71?74.

LU Anjiang, JIN Li, YANG, Jiahong, et al. Application research based on improved BP neural network algorithm in license plate recognition [J]. Journal of Guizhou University (Natural science), 2015, 32(6): 71?74.

[7] 张连滨,葛浙东,鞠明远,等.改进型神经网络在木件打磨机器人中的应用[J].林业机械与木工设备,2017,45(4):19?22.

ZHANG Lianbin, GE Zhedong, JU Mingyuan, et al. Application of improved neural network in woodpiece polishing robot [J]. Forestry machinery & woodworking equipment, 2017, 45(4): 19?22.

[8] 赵建华.基于SOM神经网络的半监督分类算法[J].西华大学学报(自然科学版),2015,34(1):36?40.

ZHAO Jianhua. Semi?supervised classification algorithm based on SOM neural network [J]. Journal of Xihua University (Natural science edition), 2015, 34(1): 36?40.

[9] 伍华丽,任心怡.基于模糊约束的数据库特定数据挖掘算法[J].计算机仿真,2016,33(10):240?243.

WU Huali, REN Xinyi. Specific data mining algorithm based on fuzzy constraint database [J]. Computer simulation, 2016, 33(10): 240?243.

[10] 白丽扬,赵金海,刘占新,等.基于数据挖掘算法的底板破坏深度预测[J].煤炭工程,2017,49(6):92?95.

BAI Liyang, ZHAO Jinhai, LIU Zhanxin, et al. Depth prediction of floor damage based on data mining algorithm [J]. Coal engineering, 2017, 49(6): 92?95.

[11] 邢开颜,李梅.数据挖掘分类算法在信号分类中的应用[J].软件,2016,37(6):1?6.

XING Kaiyan, LI Mei. Application of data mining classification algorithm in classification and recognition of signals [J]. Software, 2016, 37(6): 1?6.

[12] 任关友,王昕,李英娜,等.基于粒子群优化神经网络算法的用户防窃电研究[J].软件,2017,38(8):215?219.

REN Guanyou, WANG Xin, LI Yingna, et al. Research on user′s anti?stealing power based on particle swarm optimization neural network algorithm [J]. Software, 2017, 38(8): 215?219.

[13] HUCHAO L I, SHAO A, DENGXIN H E, et al. Application of back?propagation neural network in predicting non?systematic error in numerical prediction model [J]. Plateau meteorology, 2015, 42(6): 1198?1201.

[14] THEANDER E, JONSSON R, SJ?STR?M B, et al. Prediction of Sjogren′s syndrome years before diagnosis and identification of patients with early onset and severe disease course by autoantibody profiling [J]. Arthritis & rheumatology, 2015, 67(9): 2427?2436.

猜你喜欢

可行性分析粗糙集数据挖掘
基于Pawlak粗糙集模型的集合运算关系
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
多粒化粗糙集性质的几个充分条件
拓展训练融入中学体育教学的可行性分析
巨灾债券在风险管理中的应用
高校电子商务实践教学平台构建研究
双论域粗糙集在故障诊断中的应用
一种基于Hadoop的大数据挖掘云服务及应用
两个域上的覆盖变精度粗糙集模型