APP下载

基于支持向量机的葡萄酒品质鉴定系统开发

2018-11-17柳维生柴兰娟

软件 2018年10期
关键词:白葡萄酒红葡萄酒葡萄酒

柳维生,柴兰娟



基于支持向量机的葡萄酒品质鉴定系统开发

柳维生,柴兰娟

(苏州市立医院(北区),江苏 苏州 215001)

为了改进葡萄酒生产、帮助对葡萄酒品质评估的建模和细分市场的口味。提出了基于支持向量机技术的葡萄酒品质分类机制,该方法通过对影响葡萄酒品质的硫酸盐、酒精、残糖关键理化参数进行分析,采用matlab的GUI编程技术和数据归一化、PCA等多种数据处理手段,设计了支持该技术的品质鉴定系统,通过采用白色和红色葡萄酒样本对系统的算法思想进行了验证。

支持向量机;葡萄酒;品质;GUI;鉴定系统

0 引言

葡萄酒一度被视为一种奢侈品,如今越来越多的葡萄酒享有更广泛的消费者。酒认证和质量评价在防止非法掺假酒(以保障人类健康),保证葡萄酒市场的质量起到了至关重要的作用。较好的品质评定机制,可以有效的提高酿酒(通过确定最有影响力的因素)工艺,以及酒的品质分层如优质品牌葡萄酒(可用于设置价格)。一般葡萄酒的认证评估分理化和感官测试。理化测试习惯以酒的特点,如密度、酒精或pH值来决定,同时依靠感官检验,但是随着葡萄酒市场的扩大,这种评估很显然不能大批量、精确的分类[1]。此外,理化和感官分析的关系是复杂的,还不完全清楚,因此葡萄酒分类是一项艰巨的任务。随着信息技术的进步,使我们能够收集、储存和葡萄酒品质理化参数相关的高度复杂的数据集。应用这些数据通过神经网络、支持向量机等方法进行处理,可以很好可用于葡萄酒的评估、预测、分类等方面[2-5]。本文就是以支持向量机为基础完成分类,结合matlab来设计一个葡萄酒品质鉴定系统。

1 支持向量机介绍

支持向量机是由Vapnik领导的AT&TBell实验室研究小组在1963年提出的一种新的非常有潜力的分类技术,SVM是一种基于统计学习理论的模式识别方法,能非常成功地处理回归问题(时间序列分析)和模式识别(分类问题、判别分析)等诸多问题,并可推广于预测和综合评价等领域[6]。SVM算法能不能够够很好的实现其主要在核函数的选择上,其本质就是通过其建立的函数映射关系,将在低维度上难以划分的空间向量,转换为高维空间进行划分,通常区分以后,再通过反变换映射返回到低维度,进行输出,传统算法上这会给计算带来很大的困难,而在SVM中,核函数确能够方便的解决这个问题,只要选取合适的参数,算法就能很好的对系统进行改进。

SVM的主要思想是建立一个超平面作为决策曲面,使得正例和反例之间的隔离边缘被最大化。训练数据集到一给定的分割平面的最小距离为:

2 白葡萄酒品质鉴定系统设计

2.1 系统功能框图

系统采用matlab软件GUI设计,包含数据录入、数据预处理、用户管理、SVM核函数选择、帮助等模块,其中数据录入包含外部数据的导入、数据的导出、数据的输入。数据预处理包含主元分析、数据归一化等,SVM核函数选择将以上四种核函数进行变化选择,测试系统的性能。

图1 鉴定系统功能框图

2.2 鉴定系统算法

通过用户接口将葡萄酒检测的理化参数数据输入到系统中,通过一定的数据预处理,系统通过与经训练样本训练后成熟的模式进行比较,对测试样本给出判别,输出葡萄酒的品质等级。在设计中系统给出不同的核函数确定的分类器和多种模式库。另外,一个好的分类器也不是一个好系统的唯一标准,参数的特征选择、数据的处理等都对系统的总体性能有较大的影响[8-10]。因此设计中采用归一化数据、主元分析等方法对系统进行评估改善。下图给出了鉴定系统的流程图。

图2 鉴定系统流程图

3 算法仿真

3.1 葡萄酒数据

数据来自UCI,winequality样本[11],样本采集自葡萄牙米尼奥(北西部)地区的白葡萄酒和红葡萄酒,数据对4898白葡萄酒和1599个红葡萄酒样本进行了评定,测试选择输入变量为:1.固定酸度 2.挥发酸3.柠檬酸 4.残糖 5.氯 6.游离二氧化硫 7.总二氧化硫8.密度9 .pH值 10.硫酸盐 11.酒精十一个理化指标,每个样品,专家都进行了感觉评估(使用盲口味),将葡萄酒等级从0(极坏的)到10(优秀)个等级。下图是样本中数据品质的直方图。

图3 白葡萄酒样本品质直方图

图4 红葡萄酒样本品质直方图

3.2 实验进行

算法仿真在台湾林智仁开发的lib-svm工具箱中进行,将白葡萄酒和红葡萄酒的各种品质的2/3样本做训练样本,另1/3做为测试样本。分别选择不同的核函数进行测试,实验表明,白葡萄酒的识别率不足50%,红葡萄酒的识别率不足60%,正确率较低,为改善系统性能,对数据进行两种归一化数据的处理[12-14],系统改善不明显,再将数据经主元分析后,通过对白葡萄酒的特征选择硫酸盐、酒精、残糖等,对红葡萄酒选择硫酸盐、pH、总二氧化硫含量等,重新训练系统,性能大大改善。以下是以RBF为核函数非线性支持向量机[15-16]对白葡萄酒3类、4类和红葡萄酒3类、8类样本进行的仿真分析结果,两类样本点分别用加号和乘号表示。其分类正确率分别为98.62%和97.41%。

图5 白葡萄酒测试数据分类图

图6 红葡萄酒测试数据分类图

4 系统的实现

系统开发是基于matlab中的GUI工具箱,Lib-SVM工具箱、图像处理工具箱,并结合active控件。鉴定系统的主界面图如图7所示。

5 结论

酒品质的鉴定对产品在消费者中定位和改进葡萄酒生产工艺至关重要,但传统的酒品质主要对酒理化指标的分析和品酒师的感觉,在大规模生产中具有一定的局限性。本文对葡萄酒品质鉴定系统进行了研究,取得了较好的实验效果,进一步说明了利用新的信息手段进行酒的品质评定是可行的。

图7 鉴定系统界面图

[1] Cortez P, Cerdeira A, Almeida F, et al. Modeling wine preferences by data mining from physicochemical proper­ties[J]. Decision Support Systems, 2009, 47(4): 547-553.

[2] 范开乾, 胡访宇. 基于支持向量回归的图像超分辨率重建算法[J]. 电子技术, 2014, 4(2): 4-7.

[3] 范文兵, 方垄, 杨潇楠. 基于稀疏字典学习和核稀疏表示的激光遥感图像超分辨重建[J]. 激光杂志, 2015, 36(6): 52-58.

[4] 李驰. 基于支持向量回归的图像超分辨率重建算法[J]. 激光技术, 2016, 37(1): 138-140.

[5] 李桂来. Contour let变换在MRI图像重建算法中的应用 [J]. 激光杂志, 2015, 36(1): 49-51.

[6] Chang C C, Lin C J. LIBSVM: A library for support vector machines[J]. 2011, 2(3): 1-27.

[7] Schölkopf B. Choosing multiple parameters for Support Vector Machines[J]. 2008.

[8] 王鹏, 朱小燕. 基于RBF核的SVM的模型选择及其应用[J]. 计算机工程与应用, 2003; 39(24) : 72-73.

[9] 钱磊, 睢刚. 一种热工过程RBF神经网络模型辨识方法[J]. 自动化仪表, 2016; 37(1) : 14-15.

[10] 赵文可, 孙玉国. 弹性RBF神经网络在人脸识别中的应用研究[J]. 软件, 2018, 39(05): 203-206.

[11] Asuncion A. UCI Machine Learning Repository, University of California, Irvine, School of Information and Computer Sciences[J]. 2007.

[12] 黄浏展. 指纹识别技术在IOS开发中的应用研究[J]. 软件, 2016, 37(07): 55-60.

[13] 杨漫, 苏亚坤. 采用模糊C-均值聚类的自适应图像分割算法[J]. 重庆理工大学学报(自然科学版), 2015, 6: 85-86.

[14] 崔娅萍. 基于改进归一化割的图像分割算法研究[J]. 激光杂志, 2016, 37(2): 122-124.

[15] 何梓健, 时家明, 汪家春, 等. AOTF高光谱探测系统对伪装目标的识别研究[J]. 激光与红外, 2014, 44(7): 796-800.

[16] 胡燕燕, 李东生, 张诗桂. 凸组合核函数的支持向量机高光谱图像分类[J]. 激光与红外, 2016; 46(5): 627-630.

Development of Wine Quality Identification System Based on Support Vector Machine

LIU Wei-sheng, CHAI Lan-juan

(Suzhou Municipal Hospital (North District), Suzhou, Jiangsu 215001)

In order to improve wine production and help to model wine quality evaluation and taste of segment market, a wine quality classification mechanism based on support vector machine technology was proposed. By analyzing the key physical and chemical parameters of vitriol, alcohol and residual sugar that affect wine quality, this method designs the quality identification system supporting this technology by adopting the GUI programming technology of matlab and data normalization, PCA and other data processing methods. The quality identification system supporting the technology is also designed. The algorithm idea of the system was verified by using white and red wine samples.

Support vector machine; Wine; Quality; GUI; Identification system

U260.78

A

10.3969/j.issn.1003-6970.2018.10.036

柳维生(1980-),硕士研究生,主要研究方向:计算机应用技术; 柴兰娟(1985-),硕士研究生,主要研究方向:信息工程。

柳维生,柴兰娟. 基于支持向量机的葡萄酒品质鉴定系统开发[J]. 软件,2018,39(10):192-195

猜你喜欢

白葡萄酒红葡萄酒葡萄酒
自制的葡萄酒为啥爱“上头”?
红葡萄酒,防支架造成再狭窄
法国葡萄酒何以誉满天下
红葡萄酒煮鸡蛋可治感冒
微波灭菌对干红葡萄酒质量影响的初步研究
随机森林算法在红葡萄酒质量评价指标体系选择中的应用
基于葡萄酒理化指标的葡萄酒分级