APP下载

基于一致聚类和PLS方法的电子商务竞争力形成机理研究

2016-08-01杨坚争尹清杰

生产力研究 2016年12期
关键词:机理竞争力聚类

尹 诗,杨坚争,尹清杰

(1.上海理工大学 管理学院,上海 200093;2.浙江工贸职业技术学院,浙江 温州 325003)

基于一致聚类和PLS方法的电子商务竞争力形成机理研究

尹 诗1,杨坚争1,尹清杰2

(1.上海理工大学 管理学院,上海 200093;2.浙江工贸职业技术学院,浙江 温州 325003)

城市电子商务竞争力反映了城市的发展水平,是城市产业竞争力的重要研究内容之一。文章在分析城市电子商务竞争力的内涵及系统结构的基础上,用一致聚类改进算法对53个全国电子商务示范城市分类,用PLS结构方程模型建立了各类别城市电子商务竞争力的形成机理,并进行实证分析。结果显示,机理模型和结构要素可以解释目前中国城市电子商务竞争力的状况。

电子商务竞争力;一致聚类;结构方程模型;形成机理

一、引言

随着互联网技术的普及和应用,电子商务以其特有的开放性,在全球化市场中具有极强的竞争力。在城市的竞争中,发达城市占据领先地位,欠发达地区面临极强的挑战。而电子商务作为新兴产业为欠发达地区提供弯道超车的可能,同时可以为社会提供大量就业机会,缓解就业压力。随着“互联网+”行动计划上升至国家战略,促进电子商务快速发展已成为地方政府乃至国家经济工作的重点之一。电子商务在为改变经济增长模式,打造经济发展新引擎,激励大众创业、万众创新展示勃勃生机的同时,深刻地影响着城市的发展。

电子商务竞争力研究正引起国内外学者和研究机构的关注。Burt和Sparks通过现代零售业中电子商务的影响分析,提出电子商务的发展促进城市零售业的繁荣,越大的零售商越追求互联网优势[1]。荆丛波从电子商务对经济社会发展的影响入手,构建中国城市电子商务评价模型,同时提出电子商务全面助推城市化进程[2]。《中国中小企业电子商务发展报告2012》显示,应用电子商务率每增加1%,就业机会就能增加4万个。迅猛发展的电子商务,在拉动城市经济增长、推动城市产业结构化等方面也都显示了强大的活力。

国内外文献虽然在直接的城市电子商务竞争力形成机理的论述较少,但现有理论成果仍然是本文梳理形成机理、合理评价城市的电子商务竞争力的重要理论支撑。基于以上研究,本文以全国电子商务示范城市为研究对象,用一致聚类改进算法对我国已经公布的三批共53个电子商务示范城市进行了分类,用PLS结构方程模型建立了各类别城市电子商务竞争力形成机模型。通过城市电子商务竞争形成机理的研究,提炼提升城市电子商务发展的关键要素,为研究城市电子商务竞争力提供理论基础。

二、基于一致聚类的城市电子商务发展差异性分析

2011年国家发改委公布国家第一批21个电子商务示范城市(后增加到23个),2014年国家发改委和财政部、商务部等部门联合发文公布30个国家第二批电子商务示范城市。两批53个电子商务示范城市有4个直辖市、25个省会城市和5个计划单列市和19个其他级别的城市。这些城市的区位资源禀赋、经济发展水平存在明显差异。现有的研究少有对全国53个示范城市电子商务总体发展水平进行分析。本文首先选取电子商务企业服务水平、快递服务水平、电商交易水平、网购消费者水平、第三产业对经济贡献度五个指标对城市电子商务发展差异性进行判别分析。

(一)一致聚类方法

聚类分析(Cluster Analysis)起源于分类学,是研究如何度量事物之间的相似性和怎样构造变量分类以实现分类的多元统计方法。聚类分析依据某种相似性变量,将具有相似特征的样本归为一类,使得类内相似差异较小,而类间相似差异大[3]。经典的类内误差与准则函数(Winthin-Group Sum of Squared error,WGSS)为:

假设将n个样本tj∈CN(j=1,2,…,n)分为k类,对i= 1,2,…,k和j=1,2,…,n定义:

矩阵A=(Aij)有如下性质:Aij∈{0,1}且Aij=1(j= 1,2,…,n)

设ni表示第i中所包含的样本个数,则:

设ti∈CN表示i类的中心,则:

所以,第i类的类内差异为:

整体类内差异为:

聚类算法的目的就是寻找使得D(μ)取得最小值的μ*,即D(A*)=min{D(A)}。

当样本各自独立成类(k=n)时,D(A)取得最小值0。因此,仅凭上述准则是不能找到最优分类的,需找到其它能够分类的准则函数。同时,不同结构特征的数据进行分类时,一致聚类方法可以解决相似矩阵选取和自动确定聚类数目等问题。

一致聚类亦称聚类集成,是针对给定数据获得确定类别数目,从中选取最能反映聚类信息类别的聚类划分。常用的结合重采样和基于迭代的一致聚类方法,对于聚类数目识别不准确问题仍没有得到有效解决。鉴于Minkowski距离公式,能够准确解释数据的相似度,本文应用距离公式对收集的数据进行分析,在不需要迭代时,即能确定聚类信息的相似度度量,准确获得聚类数目信息,其算法流程如图1所示。

图1 基于Minkowski距离的一致聚类流程图

1.设定距离函数。本文采用Minkowski距离公式[4](见公式(1)、公式(2)):

公式(1)、公式(2)中,x和y为n维样本点,p和坠为距离调整参数。不同的 值构建的Minkowski距离,利用算法分析会得到不同的聚类效果。p可以取0.1到1之间的任何值,当p=1,2,∞时,公式(1)分别刻画的是数据i与j横坐标差值的绝对值之和(称为曼哈顿距离)、最短距离(称为欧氏距离)、最大差值(称为切比雪夫距离);公式(2)中坠为可调参数,通过p和坠的调整,能够用上述距离公式从不同角度反映p值的相似度信息。

本文设定p=1,2,∞三种不同的值及坠=0.1,0.3,0.5,0.8,0.9五类不同的值,通过公式(1)、公式(2)获得15种不同相似矩阵,进行聚类分析。

2.聚类算法的集成。不同的聚类算法对一致聚类算法的集成影响极为重要,基于本文研究特点,融合两种不同Laplacian矩阵构建谱聚类算法(公式(3)、公式(4))。

式中,D为将相似矩阵每行之和赋值到对角线的对角矩阵,L为相似度矩阵[5]。

3.聚类数目识别。相似度矩阵L一般被当做以样本为节点(无向图)之间的邻接矩阵,矩阵中的权值就是无向图的边(以粗细表示权值大小)。以随机游走策略在无向图中获得转移概率矩阵P,P满足下列条件:P=diag-1(S·e)·S,式中e是值全为1的向量。

令 δ(P)=λi(i=1,2,…,n,且 λnλn-1…λ1=1作为P的谱分布。因为λnλn-1…λ1=1有个特征值接近于1,λk和λk+1之间的相对距离则确定了数据聚类的数目。

4.聚类信息的获得。根据聚类数目序列k=[k1,k2,…,kn](n为选择的聚类数目)中的ki,i∈{1,2,…,n}分别进行聚类,共获得3×n个聚类结果,形成一致矩阵M。矩阵M中的元素分别为0或1,其中Mij=0表示第i个节点和第j个节点没有分到同一类,分到同一类时为1。再将一致矩阵M代替转移概率矩阵P=diag-1(S·e)·S中的S,求得P的特征值,通过特征值的分布获得聚类信息。

(二)电子商务示范城市聚类分析

基于Minkowski距离的一致聚类算法的优越性体现在聚类数目的自动识别,能够对数据进行分析并获得最佳的聚类数目信息。结合Minkowski聚类函数,建立样本之间不同维度的距离,取p∈[1,2,∞],坠=[0.1,0.3,0.5,0.7,0.9],共15种组合以覆盖参数的取值。

1.对于任取的一组 p和 坠值,令k=[k1,k2,…,kn](根据文本所掌握的城市电子商务数据规模(见表1),设k∈[2,3,4,5,6,7,8,9,],共 8种聚类数目),对于每一个 k值,分别按上述方法进行聚类,可得到8个聚类结果构建的一致相似矩阵Mi(i∈1,2,…,15)。

2.重新取一组p和坠值,重复上一步骤,得到15个一致相似矩阵Mi(i∈1,2,…,15)和相应的转移概率矩阵Pi(i∈1,2,…,15)。

3.对转移概率矩阵分别进行特征值分解,并根据特征值之间的差值判别获得聚类数目。通过对图2中转移矩阵特征值分布(统计值接近于1的特征值数目)的判别,本文所给数据的最优聚类数目为3类。

表1 城市电子商务发展五项主要指标数据(Z标准化结果)

图2 聚类数目的特征值分布图

根据表1列出的53个城市电子商务发展五项主要指标数据,利用K均值聚类法对将城市进行聚类分析,分为三类,分类结果如表2所示:

表2 城市电子商务发展水平聚类结果

其中,义乌凭借着较高的快递服务水平、电商交易水平、网购消费者水平、第三产业对经济贡献度,与北京、上海、广州、深圳、杭州聚为第一类城市。

表3 各类最终聚类中心

由表3可知,第一类的聚类中心在各项指标数值上均大于第二类,而第二类又都大于第三类,表明三个分类在电子商务发展的总体水平上排序结果为:一类、二类、三类。

表4 各类与最终聚类中心之间的距离

此外,通过对比各类与最终距离中心之间的距离可以发现,一二类之间的距离要明显大于二三类之间的距离,表明第一类和第二类的之间的分类界限更为明确,一类优于二类的优势更为明显。

三、城市电子商务竞争力形成机理与结果分析指标体系构建

目前国内外学者几乎没有涉及对电子商务竞争力形成机理的研究,电子商务评价体系主要是从电子商务对企业或网站的竞争力开展研究。我国关于电子商务评价体系的研究,较为显著的成果是CII中国电子商务总指数指标体系。该体系首次研究了我国区域电子商务评价,但由于年份较早,体系并不完善。

本文认为电子商务的发展水平主要是通过环境支撑、资源聚集和可持续发展这三个层面构成;电子商务竞争力的影响因素主要是由基础环境、区域优势、市场集中度、创新、市场拓展、开放和产业需求八个指数构成。

电子商务竞争力的显性度量指标——电子商务产业发展水平,通过电子商务规模指数和电子商务产业效益指数来衡量。选取电子商务企业服务水平和快递服务水平两个观测值作为电子商务规模指数的潜变量;选取电子商务交易水平、网购消费者水平和第三产业对经济贡献度三个观测值作为产业效益的潜变量。

电子商务发展的基础环境是多方面的,作为新兴产业,其发展离不开政府相关政策的支持和法律法规的规范;移动电话拥有率和互联网普及率是电子商务发展的“环境”基础;人均可支配收入和第三产业投资水平是电子商务发展的基础。因此,本文选取电子商务相关政策、移动电话拥有率、互联网普及率、第三产业投资水平、人均可支配收入水平四个观测值作为电子商务发展基础环境的潜变量。

区域的自然禀赋对产业发展起着重要的作用,基于本文的研究方向和以全国电子商务示范城市作为观测点,选取电子商务相关行业劳动力水平、交通便利性和地理位置水平构成三个观测值作为区域优势的潜变量。

城市电子商务的产业集中度不反映电子商务企业相对规模的差距,只笼统反映区域内相关产业的集中度[6]。本文使用产业组织理论(SCP)中的指标来量化电子商务产业市场集中度,选取网商密度水平、电商衍生水平和本地化电子商务园区水平三个观测值作为电子商务产业集中度的潜变量。

创新是电子商务核心经济发展最终动力,有利于电子商务产业的结构优化和升级,而一个城市可持续发展的创新力与城市的创新环境分不开的。为此,选取万人专利发明量、人才储备水平、R&D财政投入水平三个观测值为电子商务创新指数的潜变量。

选取电子商务拉动相关行业就业水平、电子商务行业平均收入指数和第三产业增加值三个观测值为电子商务市场拓展的潜变量,研究电子商务行业对区域就业效应和产业的贡献度。

城市良好的开放环境无疑对电子商务发展带来积极的影响,而吸引、利用外资的能力和进出口水平是其开放的显著的特性之一[7]。选取利用外资能力、货物进口水平、货物出口水平三个观测值为城市开放指数的潜变量。

电子商务产业需求由诸多因素构成,但人均社会消费品需求能力将是电子商务的产业需求直接影响因素[8]。依据本文研究方向,选取人均社会消费品需求水平、人均货物运输需求水平、人均邮电业务需求水平三个观测值为电子商务产业需求的潜变量。

综合上述分析,从我国电子商务发展的现状和特征出发,根据指标全面性和数据可得性的标准,构建我国电子商务竞争力的影响因素及其分析指标,如表5所示。

表5 城市电子商务竞争力分析指标

四、城市电子商务竞争力形成机理研究

(一)基于结构方程模型的城市电子商务竞争力形成机理研究

结构方程模型是用数学方程组的形式将事物之间的因果关系表现出来的统计分析技术。对于复杂的结构方程模型,主要有基于极大似然估计的因子模型 LISREL、AMOS等软件和偏最小二乘法的PLS算法来求解。对于电子商务竞争力的形成机理研究,本文主要关注于变量之间的预测关系,样本有限、结构方程模型较为复杂,更适用于对样本数据没有分布假设要求的PLS算法。

(二)研究假设

根据国内外学者对产业竞争力影响因素及其形成机理的研究成果,结合本文构建的电子商务竞争力形成机理指标,提出以下假设,并建立如图3所示的研究框架。

H1:区域优势对市场集中度有直接的正向影响关系

H2:基础环境对市场集中度有直接的正向影响关系

H3:基础环境对市场拓展有直接的正向影响关系

H4:基础环境对产业需求有直接的正向影响关系

H5:产业需求对市场拓展有直接的正向影响关系

H6:开放程度对产业需求有直接的正向影响关系

H7:开放程度对市场拓展有直接的正向影响关系

H8:市场集中度对产业规模有直接的正向影响关系

H9:市场拓展对产业规模有直接的正向影响关系

H10:创新指数对产业规模有直接的正向影响关系

H11:创新指数对产业效益有直接的正向影响关系

H12:产业规模对对产业效益有直接的正向影响关系

图3 电子商务竞争力形成机理

(三)数据收集

本文的数据是根据表2建立的电子商务竞争力评价指标,从53个电子商务示范城市的2015年各个城市的统计年鉴、中国城市电子商务发展指数报告等统计报告中获取,最终获得53x28组基本面板数据,并对数据进行标准化处理。通过前文对我国电子商务竞争力发展状况的分析,根据上述的研究假设,对三类城市的分组进行统计分析和假设检验,建立三类城市的电子商务竞争力形成机理模型。

(四)实证分析

表6 潜变量的信度分析

2.数据分析与假设检验。由于PLS主要是预测规范而没有做分布假设,给予统计分布假设的一般检验方法不适用于偏最小二乘法。常用的PLS算法检验有Stone-Geisser检验、Bootstrap方法等,本文选用Smart-PLS 2.0的 Bootstrap算法,根据原始样本及其经验分布的基础上作有放回的再抽样,得到较准确的检验及推理结果。

根据本文的研究假设,分别建立三类影响要素之间的路径关系,按照在0.05显著水平下t统计量达到1.96的要求,选择出可靠程度较高的影响路径[9],建立三类电子商务竞争力形成机理模型。

图4是上海、杭州等6个城市的第一类电子商务竞争力形成机理模型,有8个研究假设得到验证;H1、H4、H7和H10未得到验证。

图4 第一类城市电子商务竞争力形成机理模型

图5是无锡、宁波等城市的电子商务竞争力形成机理模型,有9个研究假设得到验证;H1假设的路径系数为负,其实证结果与假设相反。

图5 第二类城市电子商务竞争力形成机理模型

图6是徐州、烟台等第三类城市的电子商务竞争力形成机理模型,有11个研究假设得到验证;H3假设的路径系数为负,其实证结果与假设相反;假设H7未得到验证。

图6 第三类城市电子商务竞争力形成机理模型

五、研究结论

借鉴国内外学者研究成果,本文将一致聚类改进算法和PLS结构方程模型结合,在实证分析基础上,发现我国已公布的53个电子商务示范城市竞争力形成机理有以下特点:

第一,基础环境建设对不同区域电子商务竞争力的形成都有重要影响。电子商务基础环境建设直接影响本区域电子商务产业集中度,从第三类到第一类对产业集中度的影响逐步增强,说明良好的电子商务基础环境对产业集中度产生正影响,也说明电子商务是提升经济发展的新兴产业。而基础环境对产业需求的影响是有限的,只有第三类城市对产业需求有明显作用。

第二,区域优势对电子商务竞争力的影响作用各不相同。第一类城市(除义乌),区域优势没有明显差异,对电子商务竞争力形成机理的作用差异也不显著,第二类城市区域优势对产业集中度影响呈负相关,第三类城市作用差异性显著。研究结论不但说明电子商务具有跨区域空间的意义,而且对我国调整产业布局有积极的影响。

第三,创新在各类城市中影响的差异性较小,说明电子商务的发展离不开创新要素的支持。大力发展电子商务产业,一定要加大人才储备和科研投入力度,提供良好的创新资源保障。

第四,开放指数对各类城市电子商务影响差异较大,开放对第一类城市产业需求有明显的正相关,对第三类城市产业需求相对较弱,而第三类相关性不显著。梳理三类城市的划分,不难理解利用外资能力对产业聚集度高和产业聚集度低的区域,利用外资能力对电子商务的发展有较大的影响,而产业聚集度适中的区域,更多应该寻求其它因素对电子商务发展的支持。

第五,市场拓展对各类城市电子商务规模的形成影响较大,而产业需求直接作用电子商务产业拓展的发展。机理形成再次表明,大力发展电子商务产业,不但可以刺激产业需求,提高第三产业增加水平,而且可以极大拉动区域的就业水平。

第六,市场集中度高有利于电子商务规模的形成。义乌小商品市场集中度高,杭州电子商务中小企业发达和上海发展总部经济优势,都形成了较好的电子商务环境,是我国城市产业转型升级良好的案例。在全球一体化市场环境下,发展电子商务可以在全球资源重新分配中占得先机。

第七,产业规模和产业效益在不同区域中关系各不相同。产业规模对产业效益的影响由第三类到第一类不断增强,这符合新古典经济学关于规模扩大减低平均成本产生规模效益的论述。

本文根据实证研究,比较客观地探讨了我国电子商务示范城市电子商务竞争力的机理形成。针对各类电子商务形成机理的差异,因地制宜进行发展策略研究将会是城市电子商务未来的研究方向之一。

[1]BurtS,Sparks L.E-co m merce and the retail process:a review [J].Journal of Retailing and Computers and Electronics in Agriculture,2007,(57).

[2]荆丛波.电子商务助推城市化[J].全国商情,2012,13(7).

[3]周涛,陆惠玲.数据挖掘中聚类算法研究进展[J].计算机工程与应用,2012,48(12).

[4]Hathaway KJ,Bezdek JC,HuY.Generalized fuzzy c-means clustering strategies using Lp norm distances[J].Ieee Trans on Fuzzy Systems,2000,8(5).

[5]徐德刚,徐戏阳,陈晓,等.基于Minkowski距离的一致聚类改进算法及应用研究[J].湖南大学学报(自然科学版),2016,43(4).

[6]陈伟,2012.影响我国电子商务产业结构的原因分析[J].决策参考(8).

[7]郭树华,蒙昱竹,梁任敏.中国沿边省会城市开放程度对经济发展的影响研究[J].华东经济管理,2016,30(4).

[8]所志国,2012.电子商务消费环境已趋成熟[J].信息与电脑(2).

[9]曾涛,王秉琦,占绍文,2015.区域文化创意产业竞争力形成机理差异化研究[J].统计与决策(11).

(责任编辑:C 校对:R)

F713.36

A

1004-2768(2016)12-0007-06

2016-10-20

国家自然科学基金项目(70973079);沪江基金研究基地专项(D14008)

尹诗(1991-),女,河南南阳人,上海理工大学管理学院博士研究生,研究方向:管理科学、电子商务和电子商务评价;杨坚争(1952-),男,江苏无锡人,上海理工大学管理学院教授、博士生导师,研究方向:电子商务、国际贸易和国际法;尹清杰(1962-),男,河南南阳人,浙江工贸职业技术学院研究员,研究方向:大学生就业与创业教育。

猜你喜欢

机理竞争力聚类
隔热纤维材料的隔热机理及其应用
基于K-means聚类的车-地无线通信场强研究
煤层气吸附-解吸机理再认识
论外卖品牌的竞争力
雾霾机理之问
基于高斯混合聚类的阵列干涉SAR三维成像
日本竞争力
“北上广深”pk城市竞争力
一种层次初始的聚类个数自适应的聚类方法研究
DNTF-CMDB推进剂的燃烧机理