APP下载

高技术产业集群发展动态测度研究
——基于EM算法的因子分析模型1

2017-04-26卜洪运陶玲玲赵琳皓

华东经济管理 2017年5期
关键词:高技术集群京津冀

卜洪运,陶玲玲,赵琳皓

高技术产业集群发展动态测度研究
——基于EM算法的因子分析模型1

卜洪运,陶玲玲,赵琳皓

(燕山大学经济管理学院,河北秦皇岛066004)

文章基于波特模型构建高技术产业集群发展的测度指标体系,通过对因子分析法中因子载荷矩阵的估计方法进行改进,选取计算结果具有很好稳定性的EM算法进行估计,进而得到综合因子得分,并通过矩阵最大方差旋转找出潜在因子。对2000-2014年京津冀高技术产业集群发展水平分别进行实证检验。结果发现,北京和河北在这十五年内高技术产业集群发展总体上呈现持续增长趋势,天津在2000-2010年间总体上持续增长,之后出现急速下降,近几年发展趋于平稳。

高技术产业集群发展;因子载荷矩阵;潜在因子;京津冀

一、引言

十三五规划的重要任务之一是依靠科学技术的进步带动产业结构调整与转型升级,进一步提高高技术产业的发展水平。京津冀的高技术产业在我国整体和区域的发展竞争中有着重要的地位。在京津冀一体化的大背景下,高技术产业的发展带动作用成了区域经济的主导。近年来,产业集群的发展优势日益显著,高技术产业集群的发展规模也在不断扩大,对区域经济发展的推动作用不断增强,高技术产业集群的发展水平逐渐成了人们关注的焦点。

关于产业集群发展的判定,各国学者有不同看法。大部分学者主要认为集群发展水平就是集群发展演化的不同阶段。国外学者Port通过研究得出产业集群的发展可以划分为三阶段:诞生阶段、发展阶段及消亡阶段[1];Ahokangas等人经过一系列的研究发现产业集群的发展过程共包括三个阶段:集群的起源和产生、增长和趋同、成熟和调整[2]。国内学者在国外研究成果的基础上进行延伸。阮建青、石琦等通过构建模型研究集群演化规律,将集群分为三个演化阶段:集群数量扩张期、质量提高期及品牌研发创新期[3]。

关于产业集群发展评价指标的选取方面。国外学者Emie Goss主要从平均产业规模、企业规模及市场规模三个方面对高技术产业及非高技术产业进行了分析研究[4]。Zhao Qiang构建了以灰色、模糊、难以量化的技术经济条件下的产业集群创新能力评价的指标体系,主要包括基本能力、输出能力、投资能力及发展能力四个方面[5]。国内学者刘小铁从四个方面构建指标体系:集群规模、集群结构、集群效应及集群网络,并进一步细分为16个二级指标进行分析[6]。李刚主要从三个方面构建了高技术产业集群发展水平的评价指标体系:生产经营水平、科技活动水平及固定资产投资水平,并且进一步细分为33个三级指标体系[7]。卜洪运等人通过从内生和外生两方面构建高技术产业集群竞争力评价指标体系,并且发现京津冀高技术产业集群的竞争力逐年增加,对推动京津冀高技术产业集发展有极大作用[8]。

关于产业集群发展评价方面。欧光军等人采用因子分析方法对高新区产业集群发展水平进行评价研究[9]。张同斌等人分析了高技术产业发展水平的梯度变迁,并采用广义排序的方法分析高技术产业发展影响因素[10]。张广海基于熵权TOPSIS法对旅游产业集群发展综合比较并进行评价[11-12]。孙道军采用主成分分析方法对我国各省市的高技术产业发展水平进行了分析[13]。

综上所述,对于产业集群发展水平的研究,主要为集群发展的不同演化阶段及通过构建指标体系对集群发展水平进行评价。但测度方法中因子分析要求数据量越大,结果准确性越高。梯度变迁分析方法仅能得出比较排序,并收敛速度较慢。熵权法过于客观化。本文为了使模型更适合于少量时序数据的分析及分析结果更稳定,对因子分析法中的因子载荷利用EM算法进行估计,进而得到综合得分。对2000-2014年京津冀高技术产业集群进行了实证检验。

二、模型分析

(一)EM算法

EM算法(又叫最大期望算法)是一种能够在不完全数据下通过迭代得到参数最大似然估计的算法,迭代速度较快并且估计结果具有很好稳定性。但要求数据满足高斯分布,过程分为E步和M步[14]。步骤如下[15]:

设θ为参数,θk为第k+1次迭代参数的估计值,x为样本数据,并服从高斯分布,f(θ|x,y)为增加数据y后关于θ的后验分布密度函数。g(y|x,θ)为潜在数据y的条件分布密度函数。

(1)E步:求y的条件期望,目的是把y积掉,即

(2)M步:极大化Q(θ,θk),即找到θk+1,使

以上述步骤迭代,至‖θk+1-θk‖<ε,ε为给定的精度值。

(二)因子分析

因子分析模型:Xi=AF+γ,假设F~N(0,Iq);γ~N(0,ψp×p);F与γ相互独立。

其中,X=(x1,x2,…,xp)'为第i个样本的p个指标,xs(1≤s≤p)已经标准化,A为因子载荷矩阵,F=(F1,F2,…,Fm)'为公共因子矩阵。

基于Thomson估计法,假设有m个公共因子与指标X作回归,用OLS估计得到因子得分:Fˆ=A'R-1X,R-1为指标的相关系数矩阵的逆。

本文基于EM算法估计因子载荷矩阵A,进而得到因子得分F。

(三)基于EM算法的因子分析

设样本为Xi(1≤i≤n),A:p×m维,ψ:p×p维,Xi:p×1维,并令θ(k)=(A(k),ψ(k))为第k次迭代参数的估计值[16]。由式(1)有:

其中:

为使Q(θ|θ(k),X)最大,对A和ψ求导,得到:

EM算法因子分析的步骤如下:

(1)设定初始值:θ(0)=(A(0),ψ(0));

(2)E步:在θ(k)=(A(k),ψ(k))下,计算每个样本对应的E(F|θ(k),Xi)和E(FF'|θ(k),Xj)(i,j=1,2,…,n);

(3)M步:计算A(k+1)和ψ(k+1);

置k=k+1,转(2),直至‖θ(k+1)-θ(k)‖<ε停止。

三、指标设计与数据来源

在产业集群中,产业及企业的整体竞争力得到大幅度提高[17]。而在波特模型中,主要有五个关键因素影响这种产业竞争力,某产业的竞争力强弱直接影响它的发展。因此本文以此为参考,构建以下评价指标。

本着系统性、科学性、客观性以及可获得性等原则,参考波特模型和高技术产业集群的发展特点,构建高技术产业集群发展水平评价指标体系。从生产及产出集聚度、企业发展与竞争程度、外围环境及市场支持度三个方面选取11个评价因子。其中生产及产出集聚度主要从生产要素集聚度与产出集聚度选取四个指标,分别为高技术企业集聚度、资产集聚度、从业人员集聚度及高技术产业产出集聚度,基于数据的可获得性由表1中的Z1到Z4代表;企业发展与竞争程度分为新产品研发生产集聚度、研发能力及投入集聚度,由Z5到Z7代表;外围及市场支持度主要从政府支持度及市场集聚度选取,由Z8到Z11代表。具体见表1所列。

随着京津冀区域的协同发展问题的提出,北京、天津及河北三地的经济协同发展逐渐成为焦点。因此,本文选取京津冀2000-2014年数据来进行研究。

本文的研究数据是根据中国经济与社会发展统计数据库、《中国高技术产业统计年鉴》(2000-2015年)、《中国科技统计年鉴》(2000-2015年)及中华人民共和国国家统计局整理归纳得出。

表1 高技术产业集群发展评价指标体系

四、实证分析

(一)京津冀高技术产业集群发展水平测度

本文基于EM算法的因子分析得到京津冀高技术产业集群发展水平测度值。本文的评价因子Z即为X=(x1,x2,…,xp)',p=11;2000-2014年数据即为样本数据Xi(1≤i≤n),n=15,经验证样本数据均符合高斯分布,可以应用EM算法;公共因子个数m=3。

1.适用性检验

为了检验本文研究数据是否符合因子分析的前提,基于SPSS19.0进行KMO和Bartlett的检验。2000-2014年北京和河北的KMO的统计量为0.717、0.753,大于0.7,天津为0.610,大于0.5,表明数据适合做因子分析。Bartlett的球形度检验结果中显著性水平均为0<0.005满足要求。因此,可以做因子分析。

选取主成分分析法来提取因子,影响因子定义为3个,得到总方差的解释表。由于篇幅限制,这里仅列出北京数据输出结果,见表2所列。

表2 解释的总方差(北京)

2.高技术产业集群发展水平测度

基于MATLAB具有高效的数值计算能力,本文通过对基于EM算法的因子分析法进行MATLAB编程,得到北京、天津、河北的高技术产业集群发展水平的因子得分。

其中,本文精度ε选取为0.001,最大迭代次数为1 000。在对北京的数据进行EM算法因子载荷矩阵的估计时,共迭代22次,达到给定的收敛精度范围‖θk+1-θk‖=9.210 6e-004。为了找到评价因子中隐藏的变量,进一步分析公共因子在实际问题中的解释及分析能力,通过MATLAB编程对EM算法得到的因子载荷矩阵进行最大方差旋转,得到结果见表3所列。

表3 最大方差旋转后因子载荷矩阵

由表3可得,公因子1在Z1到Z5之间因子载荷值较大。其中,Z1、Z2、Z4为代表高技术产业集群规模的指标,Z3和Z5代表高技术产业集群的产出效益的指标。因此,公因子1可以取名为规模及效益因子;公因子2在Z9到Z11之间因子载荷值较大,它们主要反映高技术产业集群的技术扩散指标。因此,公因子2取名为技术扩散因子;公因子3在Z6到Z8之间因子载荷值较大,它们主要作为研发水平的评价指标。因此,公因子3取名为创新因子。天津、河北与北京的分析结果相同。主因子命名表见表4所列。

表4 主因子命名表

基于MATLAB由因子得分公式得到高技术产业集群发展水平评价指标的三个主因子得分,见表5所列。

表5 北京基于EM算法的因子得分

其中,天津和河北的样本数据进行EM算法计算时迭代次数分别为330次和104次。收敛精度分别为2.117 3e-004和6.113 7e-004。

3个公因子的得分F1、F2、F3,得到高技术产业集群发展水平综合测度值公式如下:

北京、天津、河北三地2000-2014年高技术产业集群发展水平因子综合得分见表6所列。由于对原始数据进行了标准化处理,因此结果中出现负值。

表6 京津冀高技术产业集群发展水平综合测度值

(二)京津冀高技术产业集群发展动态分析

为了便于观察,由表6中北京、天津、河北的高技术产业集群发展水平综合测度值做出如图1所示的图形。

图12000 -2014年京津冀高技术产业集群发展水平趋势

由图1可以发现,北京的高技术产业集群发展水平在2000-2007年间增长速度较快,原因可能是北京市政府在1999年颁布的《关于进一步促进高新技术产业发展若干政策的通知》,这一政策的实施极大地推进了北京高技术产业的发展,并且高技术产业发展的政策环境也在不断优化中,促使北京的高技术产业发展水平一路飙升;2008年集群发展水平稍有下降,原因应该是受到金融危机的影响,但影响程度不是很大,这种降低持续到2010年。此后,直到2013年发展水平逐渐增强,原因主要是北京市政府及国家出台的各种促进高新技术产业的相关政策。如2009年,国务院提出的“中关村国家自主创新示范区”、中关村科技园区颁发的《关于促进中关村高新技术企业发展的若干意见》等相关政策。但2014年集群发展水平突然再次下降,并且幅度为近十五年来最大。可能是北京的技术引进经费较2013年大幅降低,发展水平及高技术产品出口量也有所减少等原因。相比较天津和河北,在2000-2005年间,北京的高技术产业集群发展水平略低于天津和河北,但从2006年开始赶超天津和河北,并一直处于高发展水平,至2014年发展水平明显高于天津和河北。

天津的高技术产业集群发展水平变动最大,2000-2003年间发展水平基本保持不变,从2004年开始持续上涨,这和天津自1999年来实施组织了25个国家高技术产业化项目有很大关联,这些项目到2002年底有20个重大产业化项目建成投资,这对增加高技术产值起着重要的作用,但是这些项目的推动作用具有延迟的效应。而在此期间,天津政府对于外商投资优惠较大,这在一定程度上降低了股份制和民营企业的积极性,对产业的快速发展有一定的阻碍作用。在2008年发布《天津经济技术开发区促进高新技术产业发展的规定》也极大的推动了天津高技术产业集群的发展。增长持续到2009年超过北京和河北,但从2010年发展水平有所降低,2011年发展水平出现急速下降,明显低于北京和河北。产生这种现象的原因是天津在2010年高技术企业数、R&D项目数、外资企业数比前几年突然有所减少,2011年高技术企业数大幅降低、从业人员相比前几年也有所减少、企业研发费用及技术引进经费大幅减少,新产品销售收入也有所降低等原因,导致天津高技术产业集群发展水平在2011年急速下降。从2012年开始有所恢复,但在2012-2014年间发展水平基本保持不变。

自1994年起河北省为促进高技术产业的发展提出了一系列政策措施,包括政府补贴、税收优惠及政府采购优惠等政策。但由于河北省主要以重工业为主,高技术企业数很少,高技术产业集群环境也不完善等原因,使得河北省高技术产业集群发展水平虽然在不断增长,但幅度很小。在2000-2014年间相比较北京和天津波动较小,在2000-2005年间,波动较频繁。从2006年开始,集群发展水平基本保持平稳发展。但在2014年出现较大幅度下降,至2014年与天津高技术产业集群发展水平基本持平。

为了直观分析2000-2014年京津冀高技术产业集群发展水平的变化趋势,本文定义综合得分变化值=当年的综合得分-上一年的综合得分。鉴于没有1999年的综合得分,将2000年选为基期,变化值取为0。由表5数据中北京、天津、河北三省的高技术产业集群发展水平综合测度值进行处理做出如图2所示图形。其中,(a)为北京的变化趋势图,(b)为天津的变化趋势图,(c)为河北的变化趋势图。

图22000 -2014年京津冀高技术产业集群发展水平变化趋势

由图2(a)中可以看出,2000-2014年北京高技术产业集群发展水平变化不大,在2000-2006年间变化值较大,均为正数,变化值曲线在综合分数线上面。从2006年开始至今,变化值逐渐变小,并且变化值线在综合分数线下面。2014年变化值稍有增加,但是仍为负数,并且在综合得分下面。说明未来一年北京高技术产业集群发展水平还将有所减缓或者保持平稳发展;由图2(b)中可以看出天津在2000-2006年间变化值线在综合得分上面,2006-2010年间变化值线在综合得分下面。从2011年开始,变化值线在综合得分之上,到2014年变化值线有增长趋势。说明天津高技术产业集群发展水平在未来一年可能增加;由图2(c)中可以看出,河北从2006-2012年间变化值基本稳定,变化值线在综合得分下面。从2013变化值增加,并且有继续增加趋势,至2014年变化值线位于综合得分线之上,说明未来一年河北高技术产业集群发展水平很可能有所增强。

五、结论及政策建议

(一)主要结论

本文从生产及产出集聚度、企业发展与竞争程度、外围环境及市场支持度三个方面选取11个高技术产业集群发展水平评价因子。基于EM算法的因子分析法得到综合的因子得分,并分析出潜在的公因子。通过EM算法进行因子载荷的估计使结果具有很好的稳定性,并且适用于样本数据较少的估计。对京津冀三省2000-2014年高技术产业集群进行实证检验,得出以下结论:

北京和河北在这十五年间高技术产业集群发展水平总体呈现持续增长趋势,天津在2000-2010年间总体呈现持续增长趋势。到2014年,北京的发展水平最高,天津略高于河北;从综合得分变化值得到未来一年中,北京的高技术产业集群发展水平将有所减缓或者保持平稳发展,天津和河北将会有一定程度的提高。

(二)政策建议

根据研究结果,对京津冀高技术产业集群发展本文给出如下相关政策建议:

北京应该积极开展高技术企业、高校、科研单位的合作对接,充分发挥高校高层次人才的科研单位的科研能力。组织科学技术人员进行高技术企业的科研活动,解决技术问题,做好产品开发工作。促进科学、产业和贸易相结合,加快科技成果的转化。政府应该明确企业技术创新能力[19],建立有效的权力体系,完善服务流程,使得企业在技术创新等方面形成科学的、面向市场的人才培养激励机制。

天津应该在扩大高技术产业集群规模的基础上,进一步形成高技术产业集群的规模经济,提高企业效益。加快形成有效的市场结构,针对高技术产业的不同特点采取不同的应对政策。政府加大力度鼓励支持高技术研究及创新活动,增加技术研发经费的投入,使发展水平逐步提高。

在弄清河北高技术产业的主次关系的情况下,突出发展主导产业,使主导产业的发展优势凸显出来。不断扩大高技术产业的规模,政府应该增加对高技术产业发展支持的相关政策,吸引优秀的人才及高端的技术,增强研发创新能力。对现有的高技术产业集群进行合理的布局,优化产业结构,增强集群竞争能力,进而使高技术产业集群发展水平得到提高。

[1]Port M.On Competition[M].Boston:Harvard Business School Press,1998.

[2]Ahokangas P,Hyry M,Rasanen P.Small Technology-BasedFirms in a Fast-Growing Regional Cluster[J].New England Journal of Entrepreneurship,1999,2(1)19-25.

[3]阮建青,石琦,张晓波.产业集群动态演化规律与地方政府政策[J].管理世界,2014(12):79-91.

[4]Goss E,Vozikis G S.High tech manufacturing:Firm size,industry and population density[J].Small Business Econom⁃ics,1994,6(4):291-297.

[5]Qiang Z,Wuliang P.Grey hierarchy comprehensive evaluatu⁃ion of industrial cluster′s innovative power[R].IEEE Inter⁃national Conference,2010.

[6]刘小铁.产业集群发展水平的评价模型及指标体系[J].江西社会科学,2013(10):54-58.

[7]李刚.我国高技术产业发展水平与集群水平评价及相关关系研究[J].工业技术经济,2014(1):29-33.

[8]卜洪运,陶玲玲.基于指数型功效函数的高技术产业集群竞争力评价研究——以京津冀为例[J].工业技术经济,2016(7):19-27.

[9]欧光军,孙骞,王茜.高新区产业集群化发展水平评价研究——基于湖北高新区的实证分析[J].技术经济与管理研究,2013(4):111-115.

[10]张同斌,范庆泉.中国高新技术产业区域发展水平的梯度变迁与影响因素[J].数量经济技术经济研究,2010(11):52-65.

[11]张广海,李华.中国旅游产业集群发展水平评价及空间格局演变[J].旅游论坛,2013,6(2):24-30.

[12]张广海,刘真真,李盈昌.中国沿海省份旅游产业发展水平综合评价及时空格局演变[J].地域研究与开发,2013,32(4):22-27.

[13]孙道军,王栋.中国区域高新技术产业发展水平的实证研究[J].统计与决策,2011(10):123-126.

[14]李顺静.基于不完全数据的最大似然估计方法——EM算法[J].重庆工商大学学报:自然科学版,2014,31(5):29-33.

[15]王爱平,张功营,刘方.EM算法研究与应用[J].计算机技术与发展,2009,19(9):108-110.

[16]周兴才.基于公共因子扩展的因子分析的EM算法[J].数学的实践与认识,2006,36(12):174-179.

[17]张国安.产业集群对我国高新科技园区发展的影响[J].科技进步与对策,2007,24(5):85-87.

[18]张驰,陈刚,王敏娟,等.移动学习中使用EM算法的学生聚类分析[J].中国远程教育,2009(5):68-71.

[19]曾琎.文化创意产业集群化发展对策研究[J].科技进步与对策,2012,29(15):71-75.

A Study on Dynamic Measurement of High-tech Industrial Cluster Development—The Factor Analysis Model Based on EM Algorithm

BU Hong-yun,TAO Ling-ling,ZHAO Lin-hao
(College of Economics&Management,Yanshan University,Qinhuangdao 066004,China)

Based on the Porter Model,this paper constructs a measurement index system of high-tech industrial cluster development. Then the paper,through the improvement of estimation method for factor loading matrix in factor analysis method,selects the EM algo⁃rithm to make estimation,which the calculation results have good stability,gains the comprehensive factor score,and finds out the poten⁃tial factors by the maximum variance rotation of the matrix.The paper also carries out empirical tests on the development levels of hightech industrial cluster in Beijing-Tianjin-Hebei region from 2000 to 2014 respectively.The results show that the development levels of high-tech industrial cluster in Beijing and Hebei show a sustained growth trend over the past 15 years,whereas the development level of high-tech industrial cluster in Tianjin presents a continued growth in general from 2000 to 2010,then a sharp decline,and tends to be a steady development in recent years.

high-tech industrial cluster development;factor loading matrix;potential factor;Beijing-Tianjin-Hebei

F263

A

1007-5097(2017)05-0115-06

[责任编辑:张兵]

●经济观察

10.3969/j.issn.1007-5097.2017.05.016

2016-08-24

河北省社会科学基金项目一般项目(HB16YJ091);河北省社会科学发展研究课题(201603020239)

卜洪运(1962-),男,内蒙古呼和浩特人,教授,硕士生导师,研究方向:产业经济;陶玲玲(1991-),女,辽宁铁岭人,硕士研究生,研究方向:产业经济,区域经济;赵琳皓(1990-),女,河北衡水人,硕士研究生,研究方向:产业经济,金融工程。

[DOI]10.3969/j.issn.1007-5097.2017.05.017

猜你喜欢

高技术集群京津冀
2021年上半年高技术制造业快速增长
海上小型无人机集群的反制装备需求与应对之策研究
一种无人机集群发射回收装置的控制系统设计
Python与Spark集群在收费数据分析中的应用
勤快又呆萌的集群机器人
欧阳明高技术控的产业情怀
京津冀大联合向纵深突破
京津冀一化
养老“京津冀一体化”谨慎乐观看
航天项目管理——高技术复杂项目管理