APP下载

基于数字图像数据的烤烟成熟度指数研究

2013-03-21刘剑君杨铁钊朱宝川梅芳张小全

中国烟草学报 2013年3期
关键词:马赛克成熟度像素点

刘剑君,杨铁钊,朱宝川,梅芳,张小全

1河南农业大学烟草学院,郑州 450002;

2河南省烟草公司郑州市公司,郑州 450016

成熟度是重要的烤烟品质因素,正确掌握采收成熟度是提高烟叶产量和质量的关键技术[1,2]。《烤烟烘烤技术规程》(GB/T 23219—2008)将采收烟叶成熟度划分为欠熟、尚熟、成熟、完熟、过熟、假熟六种状态,生产中通常用叶片颜色和叶龄相结合的感官识别办法判断烟叶是否成熟[3,4],也有采用比色卡比色、抽屉试验、烘烤试验、化学成分分析等方法判定烟叶成熟度的报道[5,6]。20世纪初发展起来的色度学理论和实践为烟叶颜色的仪器测定和定量描述提供了可能性[7,8],随着光电技术的发展,数字摄录设备[9]、叶绿素仪[6,10]、光谱仪[11,12]、色差计[13]等设备被用于烟叶成熟度数据采集,使用神经网络、模糊数学等数据处理方法量化研究烟叶成熟度,但目前尚无符合生产习惯,能投入实用的烤烟成熟度量化判断方法和测量的仪器。本文采用数字图像设备采集烟叶图像,通过分析烟叶成熟过程中各像素色度比例的变化,对图像数据进行处理转化,寻找能表征成熟度变化的特征变量,旨在找出一种简单实用的烟叶成熟度量化方法,使成熟度可以直观地进行客观比较,为机器识别烟叶成熟度提供理论依据。

1 成熟度指数的定义及提取方法

1.1 成熟度特征变量分析

颜色变化是烤烟成熟过程中最主要的外观特征,随着烟叶从欠熟向尚熟、成熟、过熟转化,烟叶颜色由浓绿向浅绿、绿黄、黄绿、浅黄(金黄)、黄白转变,甚至接近于白色,其中品种一致、生长管理条件相似的烟叶颜色变化趋势接近[2,4],这是根据叶片颜色判断烟叶成熟度的技术基础。常用的RGB色彩系统中,彩色数字图像的每个点都由不同比例的红、绿、蓝三基色混合而成,是一种复合色,像素点色彩数据由R、G、B三个值组成。定性分析烟叶成熟过程中颜色的变化,总体上是绿色所占比例由大变小,而红色所占比例由小变大,其图像中各像素点的三基色颜色值R、G、B则表现为逐渐接近极值255。本文以图像中各像素点的三基色颜色值为基础,分别采用红色R、绿色G、蓝色B、R+G、R+B、G+B、R+G+B和“RGB颜 色 值”C =(65536×Red)+(256×Green)+(Blue)设置了8种像素值合并算法,并进行分析研究和实验论证,以便从中筛选能够较好的表征成熟度的变量Ma。

像素点成熟度值MaX定义:

为符合实际和方便使用,将像素点成熟度值范围限定在0-10范围内,其计算方法为:

MaR=10×R/255;

MaG=10×G/255;

MaB=10×B/255;

MaC=10×C/WC; 其中WC为白色颜色值,WC =(65536×255)+(256×255)+(255)= 16777215。

MaRBG=10×(R+B+G)/(255×3);

MaRG=5×(R+G)/255;

MaRB=5×(R+B)/255;

MaBG=5×( B+G)/255。

1.2 马赛克压缩原理

常用的数字图像采集装置总像素一般在30万以上,本次试验使用的数码相机最低分辨率为368万像素,过高的分辨率只会增加无意义的计算时间,对于判断烟叶成熟度并不必要,所以需要对图像数据进行压缩,最简单的图像压缩方法是等间隔抽样。马赛克算法本质上是将相邻的颜色相同或近似的像素颜色合并为一个值,在数据量大幅减少的同时又能体现原始图像特征。算法的定义为:设I是所有图像组成的图像集合,P是一幅较大的图像,S={S1,S2,…Sm}是形状和大小都相同的若干个小图像组成的图像集合,Dsi<<Dp(Di表示图像 i的面积 ),A={A1,A2,…An} 为用图像网格G分解图像P所得到的小图像集合,其中,Ai(i=l,2,…n)的形状和大小都与S中的小图像相同,f是S×A—I的映射,R是集合B={bj=f(Si,Aj)|Si∈S,Aj∈A,i=1,2,3,…n, j=1,2,…m}中图像按照网格G拼接而成的目标图像,如果q(R,P)=l且 q(Si,Bj)=l,其中 Si∈ S,Bj∈ B,i=l,2,…n,j=1,2,…m,则R为由S中的小图像组成的图像P的一个马赛克图像,其中q(R,P)表示图像视觉中图像R和P的相似度,如果相似为1,否则为0。选择合适大小的图像网格G的分解图像A(与S形状大小相同),可以有效减少图像失真。本文利用马赛克算法进行图像压缩,并对不同的压缩比例进行研究,选择最佳参数。

1.3 TRIMMEAN函数去极值

由于烟叶在自然环境中生长,受到烟草类型、品种、生长环境、施肥、栽培措施等因素的影响,以及生长时期、着生部位不同,叶片基本色有一定差异;同时,由于烟株整体受光不均匀,下部叶片的叶尖和叶基部也有一定色差;此外叶片可能有病斑、虫孔、风摩或粘附砂土以及在图像采集时叶片皱折所产生的阴影和去背景时边界区分不准确等原因,使得叶片图像存在深浅不同的杂色,其程度随着叶片叶龄的增加即成熟度的提高呈上升趋势。分析烟叶图像特征和数据分布直方图发现,杂色的颜色值多为较大和较小的极值,因此按一定比例去除两端的极值,可以在一定程度上剔除杂色的影响,使提取的成熟度指数更能接近烟叶基本特征、体现叶片图像的主色调。

函数TRIMMEAN 可从数据集的头部和尾部除去一定百分比的数据点,然后求平均值,本文利用TRIMMEAN函数对不同极值除去比例进行研究,寻找最佳去极值比例。

1.4 成熟度指数定义

本文定义鲜烟叶叶片成熟度指数为:利用TRIMMEAN函数适当除去烟叶(抠出背景并进行适当压缩)像素成熟度值MaX的部分极值所得到的平均值。

2 实验结果与分析

实验采用的不同类型典型烟叶样本取自河南农业大学科教试验园区的烟叶试验田。

2.1 试验烟田基本情况

试验地土壤全氮0.95g/Kg,碱解氮73.54mg/Kg,速效磷34.12 mg/Kg,速效钾130.7 mg/Kg,有机质9.96g/Kg,pH值8.19。试验品种中烟100,施氮量60 kg/hm2。田间管理参照《烤烟栽培技术规程》(GB23221-2008)进行。

2.2 图像采集装置

使用佳能500D数码相机,自制规格为100 cm×80 cm×100 cm的反射拍摄灯箱,箱体包裹银色反光布,箱体顶部中央安放相机,并均匀固定6个功率125W色温为5500的摄影灯泡,底部载物台使用白色聚四氟乙烯板制作以方便抠图操作[14],在底板上固定与底边相同尺寸的卷尺。打开拍摄灯箱光源并稳定10 min后,使用手动模式拍照,拍照设置为快门:1/125秒;光圈:F8;感光度:ISO200;白平衡:自动;取景大小:2352×1566。

2.3 马赛克压缩比例的选取

本实验中采集的烟叶图像大小为2352×1566×3,抠除背景后需要处理的数据量为百万级别,必须对图像数据进行压缩以减少成熟度指数的计算时间。因此在选择最佳成熟度表征变量前,先研究了不同马赛克压缩比例对图像质量的影响,以便在保证图像色彩不失真的情况下,尽量减少数据处理量。使用马赛克处理软件取马赛克系数3、5、10、20、30、40、50、60、70对典型成熟烟叶图像数据进行处理,计算 了 MaR、MaG、MaB、MaC、MaRBG、MaRG、MaRB、MaBG值。图1给出马赛克系数为3、20、70时MaR、MaG、MaB值的Gaussian拟合曲线,以及不同马赛克系数下整片烟叶像素点成熟度均值的变化趋势。

图1 不同马赛克压缩比例下像素点成熟度指数分布

由图1可以看到:当马赛克系数3,即叶片颜色取点数量为40个左右时,由于像素点太少,无法使用这些点成熟度值拟合出曲线,随着马赛克系数(取样点数)的增加,像素点成熟度值拟合曲线的特征开始显现,当马赛克压缩比例为5%,即取样数量大于100个以上时,数据分布已形成一条视觉特征基本稳定的曲线。说明就特定的烟叶图片数据,当马赛克压缩比例达到一定值,即图像数据达到一定数量时,像素点成熟度值分布特征曲线已经显现,继续提高马赛克压缩比例不会改变其总体变化趋势。不同马赛克系数下各成熟度表征处理数值最大相差0.01,基本上不再随压缩比例变化,考虑到在不影响数据处理速度的前提下尽量提高取样的代表性,所以后面的研究选定马赛克系数为20。

2.4 成熟度表征变量的选取

对烟叶图像进行数据处理的目的是为了获得一个可进行比较,能用于判断成熟程度的单值变量。理论上分析,MaC中R颜色值的系数远远大于蓝绿两色,所以基本上和MaR值相等,从图1中也可以看到MaR和MaC两条曲线几乎重合,其他几个变量MaRGB,MaRG,MaRB,MaGB实际上是MaR、MaG、MaB的转化值或平均值,其变化趋势取决于这三个值。对MaR、MaG、MaB、MaC,MaRBG、MaRG、 MaRB、 MaBG的数据分布作Gaussian拟合曲线进行验证,得到与此相符的结论。

为直观表达,图2给出了同株烟上的欠熟、尚熟、过熟烟叶的MaR、MaG、MaB值Gaussian拟合曲线。烟叶由欠熟、尚熟向过熟变化过程中,叶片颜色整体上由绿转黄,其图片像素中的R、G、B颜色值也呈现逐步提高的趋势,但MaR、MaG、MaB值的变化区间并不完全相同,不同成熟度烟叶的MaB值变化区间很小且数据重叠,难以区分;MaG值已随着烟叶的成熟呈现出明显的区间变化,但变化区间小于MaR;MaR值随着成熟度的增加阶次上升且变化区间较大。图2给出的数据中,欠熟叶的MaR值多介于2~4之间;尚熟叶的MaR值多分布在3~6之间;过熟叶的MaR值集中在7~9之间,区间非常明显,接近感官判断结果,在本文给出的8个成熟度值处理中效果最好。本文后面的研究选用变量MaR计算成熟度指数。

图2 不同成熟度表征变量的数据分布

2.5 不同去极值比例对成熟度指数的影响

由于种植条件及各种自然因素的影响,烟叶叶片颜色往往不够均匀,会出现一些杂色,图2中显示的像素点成熟度值分布情况证实了这一点,为得到烟叶叶片成熟度特征变量的主基色,有必要除去这些杂色,由于这些杂色在数据中多表现为极值,因此对获取的像素点成熟度值数据进行处理,去除一定比例的极值点,会有效提高用像素点成熟度值的平均值计算出的叶片成熟度指数的代表性。《烤烟》国家标准(GB 2635—92)中,烟叶允许20%以下的残伤、破损,加上浅色叶脉部分,剔除杂色数据的比例理论上应在30%左右。图3是对整株烟叶进行验证的结果,在叶片杂色部分比例不超过规定的条件下,当去极值比例分别取0、5%、10%、15%、20%、25%、30%、35%、40%、50%、60%、70%、80%、90%时,正常生长的烟叶成熟度指数趋近于一条直线,其中去除极值比例达到25%左右时,数据的差异已不明显,本研究中采用去除30%极值的比例处理图像数据,以便更准确地表现叶片的主色调。过熟烟叶因杂色部分所占比例较大,不同去极值比例对其成熟度指数影响较明显,实际生产中可能还会出现一些由各种原因造成的大比例残伤和破损的烟叶,这种情况下可根据所采集样品实际调整确定最佳去极值比例。

2.6 整株烟叶的成熟度指数变化特点

为验证以R颜色值表现烟叶成熟度的科学性,在田间留单株烟叶,打顶后不进行采收,于圆顶期摘取烟株上的所有叶片进行数据处理并计算成熟度指数。全株32片烟叶,感官判断的结果是底部3片过熟,下部3片烟叶基本成熟,中部12片烟叶尚熟,上部14片欠熟。图4所示曲线上的每一个点代表一片烟叶的成熟度指数,过熟的3片烟叶成熟度指数在8以上,尚熟烟叶的成熟度指数在4~6之间,3片下部烟叶已接近成熟,欠熟烟叶的成熟度指数在4以下。烟叶开始落黄后,随着黄色所占比例的提高,成熟度指数呈现出明显的层次性分布,其中叶龄最接近的9片上部叶成熟度指数基本相同,并与中部叶,下部叶区别明显,基本上可以按叶片分化时间进行分组。说明采用MaR值区分烟叶成熟程度是可行的,其数据较感官识别结果更加细化。同时本研究表明以像素点成熟度值表示的成熟走势与叶龄相关性较强,研究数据支持烟叶生产中使用叶龄判断烟叶成熟度的方法[3]。

图3 不同去极值比例对烟叶成熟度指数的影响

图4 整株烟叶成熟度指数的分布

2.7 特殊烟叶的像素点成熟度值分布特点

图5是典型的欠熟、成熟、过熟烟叶和遮荫烟叶MaR值的Gaussian拟合曲线。正常发育的烤烟烟叶主要由颜色较浅的叶脉和颜色较深的叶片组成,其MaR值分布曲线为一条单峰曲线,其中两头为极值区,中间为数据集中分布区。欠熟烟叶的叶色呈较均匀的亮绿色,整片烟叶MaR值大多分布于一个较陡的波峰内;成熟烟叶的叶色变为黄绿色,其MaR值高于欠熟烟叶,分布曲线与欠熟烟叶类似,但波峰更高更陡;过熟烟叶的叶色黄白,杂色增多,其MaR值相对最高,但MaR值分布曲线波峰明显较欠熟和成熟烟叶平缓。遮荫烟叶由于光照不足部分烟叶已变黄而另一部分仍为绿色,其MaR值分布曲线跨越欠熟和成熟烟叶,波峰低且平缓,说明其色素点分布区域较广。由于成熟度指数是平均数,单从数值上难以把特殊烟叶区分开来,所以采用机电装置自动判断烟叶成熟度时还需要考虑数据分布区间以分辨特殊烟叶。

图5 特殊烟叶像素点成熟度指数的分布

2.8 暗箱变黄过程中成熟度指数的变化

烟叶采收装入烤房后,离体烟叶进入一个人为控制条件下的变黄和失水过程,在变黄前期和中期,烟叶变化与类似于大田后期,也被称之为烤房内的后熟。参照《烤烟品种烘烤特性评价》(YCT 311—2009),采用暗箱变黄试验进行了验证,图6列出了2片尚熟烟叶和2片成熟烟叶在暗箱条件下的成熟度指数变化。随着烟叶变黄程度的提高,成熟度指数也随之提高,成熟度基本相同的烟叶成熟度指数变化趋势类似;成熟度不同的烟叶变黄时间有差异,但达到相同的成熟度后的变黄曲线接近。烟叶在烤房中变黄并不是一个线性过程,色度转换呈现出一定的阶梯性,这与感官鉴定的烟叶变黄过程一致。从烟叶变黄过程判断,理想的升温时间应为成熟度指数稳定在8左右时,与烘烤技术中烟叶8成黄时转火的技术基本吻合[15],说明选用以R颜色值为表征变量的成熟度指数也可以用于判别烟叶烘烤变黄期的烟叶变化。

图6 暗箱试验中不同成熟度烟叶成熟度指数变化

3 讨论

烟叶在大田生长发育直到进入烤房烘烤的变黄前中期,鲜烟叶的颜色都是一种可辨识度较高的外观特征,本文研究了量化鲜烟叶颜色特征比较成熟变黄程度的方法。研究使用叶片全部数据而不是部分取点,以提高代表性;参照烟叶去杂原则去掉一定比例的极值以减小误差;选择与感官认定成熟度数值最接近的计算方法,定义白色为10成熟,把烟叶成熟度转换成极值为10的色度比例值,将烟叶各像素点色度比例值的平均数定义为叶片的成熟度指数,使成熟度可以直观地进行比较。成熟度指数使成熟度数据更加细化,能从数值上区别感官认为相似的颜色,甚至可以用来表征成熟的早晚。

在本文的栽培和图像采集条件下,青烟的成熟度指数小于4,未熟烟叶的成熟度指数在4到6之间,成熟烟叶的成熟度指数在5.5到7.5之间,成熟度指数大于7.5为过熟,结合叶片不同点成熟度值分布的差异还可以进一步区分病斑过多或遮荫等特殊烟叶。

本文针对特定品种和栽培条件下的典型烟叶进行了成熟度指数量化研究,大致得到了不同成熟度所对应的成熟度指数值范围,由于实际生产中影响烟叶颜色的因素较多[16],文中所给出的不同成熟度对应的成熟度指数值范围可能不能直接用于其他情况下栽培的烟叶或其他品种的烟叶,不同于本文品种或栽培条件的烟叶还需要用大量的典型烟叶进行验证,并进行暗箱试验以检验判断的符合性,从而对不同的烟田给出具体的成熟度指数标准。对于因土壤肥力条件不同,栽培习惯差异,气候因素影响等造成的成熟度表征变量差异问题,还可以考虑把欠熟、过熟烟叶的成熟度指数设为定值,采用相对成熟度指数来表示,使成熟度指数值更接近于烟叶生产实际。

本文利用数码相机采集图像并利用计算机对数据进行处理,在对烟叶成熟度表征变量进行筛选的基础上,提出了一种成熟度指数的算法,并初步从理论上验证了其可行性,但显然不适于提供给烟农使用或在采收现场实时进行成熟度检测,技术进入实用阶段还需要针对不同环境和烟叶类型建立数据模型,开发软件程序,利用简单的CCD或COMS以及嵌入式系统构建更简易的低成本的小型实时检测系统也是进一步研究的方向之一。

4 结论

对不同类型的典型烟叶图像以及整株烟叶图像进行理论分析和验证表明,红色或RGB颜色值是比较好的成熟度表征变量。本文提出的简单的获取成熟度指数方法——通过对烟叶进行分割并进行适当比例的马赛克数据压缩,进行适当比例的去极值平均,将数值范围等比例缩放在0—10,最终计算出的鲜烟叶成熟度指数与生产实际中感官判断数据虽然不完全一致,但数据具有相同的趋势,与生产实践中使用的比例法基本吻合,可以用于进行烟叶的成熟度的量化比较。

[1] 蔡宪杰,王信民,尹启生.成熟度与烟叶质量的量化关系研究[J].中国烟草学报,2005,11(4):42-46.

[2] 李跃武,陈朝阳,江豪,等.烤烟品种云烟85烟叶的成熟度Ⅰ.成熟度与叶片组织结构、叶色、化学成分的关系[J].福建农林大学学报(自然科学版),2002,31(1):16-21.

[3] 陈逸鹏,林凯.烤烟烟叶成熟的外观特征研究Ⅰ.烟叶成熟度与叶龄的关系[J].福建农业科技,1997(5):13-14.

[4] 崔国民.烟叶的成熟度标准[J].云南农业,2006,9:16-17.

[5] 李卫,周冀衡,杨荣生,等.烟叶成熟度的研究进展[J].作物研究,2008,22(5):470-475.

[6] 李佛琳,赵春江,刘良云,等.烤烟鲜烟叶成熟度的量化[J].烟草科技,2007,1:54-58.

[7] 张建平,吴守一.烟叶颜色测量与分析[J].江苏工学院学报,1993,14(4):7-14.

[8] 张建平,高同启.烟叶颜色定量分析的研究[J].排灌机械,1993(A00):38-40.

[9] 张驰,唐勇.烤烟烟叶颜色检验系统设计方案[J].仪器仪表用户,2009,16(2):67-68.

[10] 汪强,席磊,任艳娜,等.基于计算机视觉技术的烟叶成熟度判定方法[J].农业工程学报,2012,28(4):175-179.

[11] 李向阳,刘国顺,史舟,等.利用室内光谱红边参数估测烤烟叶片成熟度[J].遥感学报,2007,11(2):269-275.

[12] 李佛琳,赵春江,王纪华,等.不同成熟度烤烟鲜叶的高光谱响应及其判别分析[J].福建农林大学学报(自然科学版),2008,37(6):565-569.

[13] 霍开玲,宋朝鹏,武圣江,等.不同成熟度烟叶烘烤中颜色值和色素含量的变化[J].中国农业科学,2011,44(10):2013-2021.

[14] 马文杰,贺立源,刘华波,等.成像环境因素对烟叶图像采集结果的影响及校正研究[J].中国农业科学,2006,39(12):2615-2620.

[15] 韩锦峰,王彦亭.烤烟叶片成熟度的研究:Ⅱ.烤烟成熟标准及不同成熟度烟叶烘烤效应的研究[J].中国烟草,1991(4):15-20.

[16] 魏春阳,张云鹤,宋瑜冰,等.基于颜色分形的不同产地烟叶聚类分析[J].农业机械学报,2010,41(8):200-205.

猜你喜欢

马赛克成熟度像素点
城中村的马赛克
AI黑科技真的能去马赛克吗
基于局部相似性的特征匹配筛选算法
产品制造成熟度在型号批生产风险管理中的应用
整机产品成熟度模型研究与建立
基于像素点筛选的舰船湍流尾迹检测算法
不同成熟度野生水茄果实的种子萌发差异研究
刚好够吃6天的香蕉
基于canvas的前端数据加密
《马赛克》