APP下载

基于偏最小二乘的泰国菠萝出口影响因素实证研究

2014-11-17郭婷婷戴琳付光辉

价值工程 2014年31期

郭婷婷+戴琳+付光辉

摘要: 本文采用偏最小二乘回归模型(PLS),以泰国菠萝贸易为例,通过变量投影重要性准则筛选自变量,由交叉有效性提取主成分,进而建立偏最小二乘回归模型。深入分析了各指标对泰国菠萝出口贸易的影响。研究表明泰国菠萝出口与原料价格及工厂生产加工速度密切相关,并且偏最小二乘回归的拟合效果优于普通最小二乘回归。

关键词: 泰国菠萝;偏最小二乘回归;交叉有效性

中图分类号:F746.12 文献标识码:A 文章编号:1006-4311(2014)31-0009-03

0 引言

目前,泰国已成为全球最大的菠萝生产国和出口国。泰国菠萝贸易主要有菠萝罐头、菠萝果汁及冰菠萝。2000-2005年,中国(台湾省除外)平均每年进口菠萝罐头1.75万吨,其中进口泰国菠萝罐头最多,平均为0.42万吨,占到了总进口量的23.90%。所以,无论是对国际菠萝罐头市场,还是对于中国菠萝罐头的国际贸易,泰国菠萝都居于十分重要的地位。因此,考察泰国菠萝的生产和加工状况、研究泰国菠萝的贸易趋势、探讨泰国菠萝产业发展的内在原因,具有十分重要的意义。

目前有灰色关联分析引力模型及普通最小二乘回归等方法的研究。由于研究方法的不同,菠萝出口影响因素也有所不同。在影响菠萝出口的众多因素中,各个指标之间存在多重共线性,偏最小二乘回归不失为能有效解决这个问题的方法之一。它结合了主成分分析、典型相关分析和多元线性回归分析的优点,能够较好地解决多重相关性的问题和样本个数少于变量个数及因变量为多个等问题。本文采用偏最小二乘回归模型,选取了14个指标分别对菠萝罐头出口数量,菠萝果汁出口数量,冰菠萝出口数量影响因素进行研究,并对各个选取因素对菠萝贸易的影响进行分析。研究结果表明,泰国菠萝出口贸易影响因素主要为原料及工厂生产加工两个方面。

1 指标选取与研究方法

1.1 指标选取 泰国菠萝贸易主要为菠萝罐头、菠萝果汁以及冰菠萝。因此,本文因变量为:菠萝罐头出口数量y1 (吨),菠萝果汁出口数量y2(吨),冰菠萝出口数量y3(吨)。自变量为:菠萝罐头出口价格x1(泰铢/吨),菠萝果汁出口价格x2(泰铢/吨),冰菠萝出口价格x3(泰铢/吨),菠萝农贸价格x4(泰铢/公克),农民卖菠萝的工厂价格x5(泰铢/公克),白糖价格x6(泰铢/公克),工厂菠萝产量x7(吨),产出菠萝罐头数量x8(吨),菠萝罐头产出指数x9(%),生产菠萝罐头的速度x10(%),消费物价指数x11(%),农产品价格指数x12(%),通货膨胀率x13(%),美元兑泰铢汇率x14(泰铢/美元)。

本文数据是120个样本,每个月是一个样本。这些数据来源于泰国农业和森林部及泰国央行,并根据上述指标进行整理。(数据见附表1)数据处理主要运用SPSS、MATLAB等统计分析软件。

1.2 研究方法 本文因变量有3个,自变量有14个,样本量为120。变量之间存在多重相关性,鉴于此,本文采用偏最小二乘回归方法来分析泰国菠萝贸易的影响因素。

偏最小二乘回归提供了一种多对多线性回归建模的方法,与传统多元线性回归模型相比,它具有以下优点:①能够再自变量存在严重多重相关性的条件下进行回归建模;②允许在样本点个数少于变量个数的条件下进行回归建模;③偏最小二乘回归在最终模型中包含原有的所有自变量;④偏最小二乘回归模型更易于辨识信息系统与噪声(甚至一些非随机性的噪声);⑤在偏最小二乘回归模型中,每一个自变量的回归系数将更容易被解释。

1.2.1 偏最小二乘回归步骤 偏最小二乘回归的步骤如下:①假设有p个因变量y1、y2、…yp与m个自变量x1、x2、…、xm,收集了n个样本点,因此得到因变量和自变量的数据阵Y和X;从X中提取第一个成分t1(t1是尽可能多的包含X变异信息的线性组合),同时从Y中提取第一个成分u1(u1是尽可能多的包含Y变异信息的线性组合),同时还必须满足t1与u1的相关程度达到最大,则得到第一对成分t1和u1;②在第一对成分被提取后,分别实施X对t1的回归以及Y对t1的回归,如果回归方程已达到满意的精度,则算法终止,否则继续第二对成分的提取(此时用y1、y2、…yp与t1的回归残差阵F1和x1、x2、…、xm与t1的回归残差阵E1代替Y和X,重复t1和u1的提取步骤,得到t1和u2);③分别建立F1和E1与t2的回归方程,如果回归方程达到满意的精度,则算法终止。如此往复,直到取得满意的精度为止;④若最终从X中提取了r个成分t1,t2,…,tr,从Y中提取了r个成分u1,u2,…,ur,可先建立y1、y2、…yp与t1,t2,…,tr的回归方程,然后再表示为y1、y2、…yp与x1、x2、…、xm的回归方程,此即为偏最小二乘回归方程式。

1.2.2 交叉有效性 在偏最小二乘回归建模中,究竟应该选取多少个成分为宜,这可通过考察增加一个新的成分后,能否对模型的预测功2 模型建立

用MATLAB对数据进行偏最小二乘回归,首先对数据进行标准化处理,根据上述算法推导,数据标准化之后即得到E0和F0,首先提取第一个假设第一个成分的交叉有效性为1,从表中可以看出,第二个成分的交叉有效性是0.0740,所以引进前两个成分对模型的预测能力有明显的改善。

另外,各个变量的VIP值也可算出,除x13对y1,y2,y3的VIP值分别等于0.222,0.2025,0.3335 其余变量的VIP值均大于0.5。即通货膨胀率x13对泰国菠萝出口贸易基本没有影响,因此可剔除x13,再进行偏最小二乘回归。

用MATLAB对剔除通货膨胀率x13后的数据重新做偏最小二乘回归,此时,自变量有13个,因变量为3个。

偏最小二乘回归提取两个主成分,得到各因变量的VIP值。除了冰菠萝出口价格x3对菠萝果汁出口数量y2的VIP值小于0.5,其余均大于0.5。即冰菠萝出口价格x3对菠萝果汁出口数量y2基本没有影响,其余自变量均对因变量有影响。

得到标准偏最小二乘回归方程如下:

预测值和观测值的比较如图1所示。

图1显示,菠萝罐头出口数量、菠萝果汁出口数量及冰菠萝出口数量的观测值和预测值相差不大,基本在一条直线上,说明用偏最小二乘回归模型对泰国菠萝贸易作预测是相当满意的。经计算,可得表2所示结果。从复测定系数R2可知,模型的预测效果很好,相对预测误差很小,模型预测效果很好。相关系数矩阵显示数据之间存在严重的多重相关性。显然,运用普通的最小二乘回归效果不好。而运用偏最小二乘回归模型的结果可以看出回归效果很好。标准回归系数图如图2。

3 总结

泰国菠萝生产量长期居世界首位。2012年6月15日泰国内阁会议批准农业部关于2010至2014年菠萝产业战略规划。该规划的核心是全力保持泰国菠萝生产与出口世界第一的地位,制定了到2014年菠萝种植面积扩大为60万莱(1莱合1600平方米),单位产量由2009年的每莱3.9吨提高至6吨,新鲜菠萝出口额达到1.1亿泰铢,菠萝加工制品出口额达到300亿泰铢等目标。本文用偏最小二乘方法对泰国菠萝出口贸易进行了分析,从偏最小二乘得到的两个成分可以看到影响泰国菠萝出口贸易的因素大致分为两种。原材料方面:泰国菠萝原材料存在时而短缺、时而过量上市,这就造成了价的不稳定性。此外,泰国菠萝种植普遍存在单产低、成本高的问题。因此建议开展提高菠萝单位面积产量方面的研究工作,构建原料和菠萝罐头生产的供需平衡,同时加工厂出口生产所需的原料应从工厂周边得到供应。工厂加工方面:对加工工厂来说,从千百个孤立、分散的小型农户那里获得稳定的符合质量要求的菠萝货源十分重要,同时还要注重工厂的专业化、产业化和一体化生产,增强原材料的利用率,改善生产速率。

参考文献:

[1]伍丽朝,谭砚文.泰国的菠萝产业[J].世界农业,2009,5(361):41-44.

[2]泰铢不停升值影响泰国菠萝罐头外销[N].越南共产党电子报,2010-09-30.

[3]郭婷.泰国的热带水果产业[N].国际商报,2006-11-14.

[4]王惠文.偏最小二乘回归方法及其应用[M].国防工业出版社,1999.

[5]董梅生.中国农业投入和产出的关系—基于偏最小二乘回归[J].技术经济,2009,28(1):37-41.

[6]章家清,张磊.中国对东盟水果出口增长因素分析—基于恒定市场份额模型的实证分析[J].经济问题探索,2012,8:134-138.

[7]霍尚一.中国水果出口贸易影响因素的实证分析[D].浙江:浙江大学,2008:1-200.

[8]程绍南.泰国菠萝产业新动向[J].中国果业信息,2006,23(6):29-30.

得到标准偏最小二乘回归方程如下:

预测值和观测值的比较如图1所示。

图1显示,菠萝罐头出口数量、菠萝果汁出口数量及冰菠萝出口数量的观测值和预测值相差不大,基本在一条直线上,说明用偏最小二乘回归模型对泰国菠萝贸易作预测是相当满意的。经计算,可得表2所示结果。从复测定系数R2可知,模型的预测效果很好,相对预测误差很小,模型预测效果很好。相关系数矩阵显示数据之间存在严重的多重相关性。显然,运用普通的最小二乘回归效果不好。而运用偏最小二乘回归模型的结果可以看出回归效果很好。标准回归系数图如图2。

3 总结

泰国菠萝生产量长期居世界首位。2012年6月15日泰国内阁会议批准农业部关于2010至2014年菠萝产业战略规划。该规划的核心是全力保持泰国菠萝生产与出口世界第一的地位,制定了到2014年菠萝种植面积扩大为60万莱(1莱合1600平方米),单位产量由2009年的每莱3.9吨提高至6吨,新鲜菠萝出口额达到1.1亿泰铢,菠萝加工制品出口额达到300亿泰铢等目标。本文用偏最小二乘方法对泰国菠萝出口贸易进行了分析,从偏最小二乘得到的两个成分可以看到影响泰国菠萝出口贸易的因素大致分为两种。原材料方面:泰国菠萝原材料存在时而短缺、时而过量上市,这就造成了价的不稳定性。此外,泰国菠萝种植普遍存在单产低、成本高的问题。因此建议开展提高菠萝单位面积产量方面的研究工作,构建原料和菠萝罐头生产的供需平衡,同时加工厂出口生产所需的原料应从工厂周边得到供应。工厂加工方面:对加工工厂来说,从千百个孤立、分散的小型农户那里获得稳定的符合质量要求的菠萝货源十分重要,同时还要注重工厂的专业化、产业化和一体化生产,增强原材料的利用率,改善生产速率。

参考文献:

[1]伍丽朝,谭砚文.泰国的菠萝产业[J].世界农业,2009,5(361):41-44.

[2]泰铢不停升值影响泰国菠萝罐头外销[N].越南共产党电子报,2010-09-30.

[3]郭婷.泰国的热带水果产业[N].国际商报,2006-11-14.

[4]王惠文.偏最小二乘回归方法及其应用[M].国防工业出版社,1999.

[5]董梅生.中国农业投入和产出的关系—基于偏最小二乘回归[J].技术经济,2009,28(1):37-41.

[6]章家清,张磊.中国对东盟水果出口增长因素分析—基于恒定市场份额模型的实证分析[J].经济问题探索,2012,8:134-138.

[7]霍尚一.中国水果出口贸易影响因素的实证分析[D].浙江:浙江大学,2008:1-200.

[8]程绍南.泰国菠萝产业新动向[J].中国果业信息,2006,23(6):29-30.

得到标准偏最小二乘回归方程如下:

预测值和观测值的比较如图1所示。

图1显示,菠萝罐头出口数量、菠萝果汁出口数量及冰菠萝出口数量的观测值和预测值相差不大,基本在一条直线上,说明用偏最小二乘回归模型对泰国菠萝贸易作预测是相当满意的。经计算,可得表2所示结果。从复测定系数R2可知,模型的预测效果很好,相对预测误差很小,模型预测效果很好。相关系数矩阵显示数据之间存在严重的多重相关性。显然,运用普通的最小二乘回归效果不好。而运用偏最小二乘回归模型的结果可以看出回归效果很好。标准回归系数图如图2。

3 总结

泰国菠萝生产量长期居世界首位。2012年6月15日泰国内阁会议批准农业部关于2010至2014年菠萝产业战略规划。该规划的核心是全力保持泰国菠萝生产与出口世界第一的地位,制定了到2014年菠萝种植面积扩大为60万莱(1莱合1600平方米),单位产量由2009年的每莱3.9吨提高至6吨,新鲜菠萝出口额达到1.1亿泰铢,菠萝加工制品出口额达到300亿泰铢等目标。本文用偏最小二乘方法对泰国菠萝出口贸易进行了分析,从偏最小二乘得到的两个成分可以看到影响泰国菠萝出口贸易的因素大致分为两种。原材料方面:泰国菠萝原材料存在时而短缺、时而过量上市,这就造成了价的不稳定性。此外,泰国菠萝种植普遍存在单产低、成本高的问题。因此建议开展提高菠萝单位面积产量方面的研究工作,构建原料和菠萝罐头生产的供需平衡,同时加工厂出口生产所需的原料应从工厂周边得到供应。工厂加工方面:对加工工厂来说,从千百个孤立、分散的小型农户那里获得稳定的符合质量要求的菠萝货源十分重要,同时还要注重工厂的专业化、产业化和一体化生产,增强原材料的利用率,改善生产速率。

参考文献:

[1]伍丽朝,谭砚文.泰国的菠萝产业[J].世界农业,2009,5(361):41-44.

[2]泰铢不停升值影响泰国菠萝罐头外销[N].越南共产党电子报,2010-09-30.

[3]郭婷.泰国的热带水果产业[N].国际商报,2006-11-14.

[4]王惠文.偏最小二乘回归方法及其应用[M].国防工业出版社,1999.

[5]董梅生.中国农业投入和产出的关系—基于偏最小二乘回归[J].技术经济,2009,28(1):37-41.

[6]章家清,张磊.中国对东盟水果出口增长因素分析—基于恒定市场份额模型的实证分析[J].经济问题探索,2012,8:134-138.

[7]霍尚一.中国水果出口贸易影响因素的实证分析[D].浙江:浙江大学,2008:1-200.

[8]程绍南.泰国菠萝产业新动向[J].中国果业信息,2006,23(6):29-30.