APP下载

旅游网站信息流距离衰减形态描述与集中度计算

2010-10-18杨小彦张秋娈王思思

地理与地理信息科学 2010年6期
关键词:访问量信息流集中度

杨小彦,张秋娈,路 紫,张 欣,王思思

(河北师范大学旅游系,资源与环境科学学院,河北石家庄050016)

旅游网站信息流距离衰减形态描述与集中度计算

杨小彦,张秋娈,路 紫*,张 欣,王思思

(河北师范大学旅游系,资源与环境科学学院,河北石家庄050016)

在获取24个旅游网站分省访问量资料的基础上,利用o rigin软件描述了其距离衰减的形态,运用区位熵、空间洛伦茨曲线与基尼系数三指标对其衰减集中度进行了计算,总结出网站信息流距离衰减集中度特征,为旅游目的地确定目标市场以及旅游网站的建设与营销提供了理论支持。研究发现:1)旅游网站信息流距离衰减主体上符合峰值衰减形态,包括指数衰减的单峰形态和高斯衰减的多峰形态,证实了地理距离仍然是虚拟旅游行为的限制因素之一。2)区位熵值大于1的省份主要是网站所在省份或经济发达省份,表明信息流距离衰减具有明显的本地集中性和经济集中性;多数旅游网站的空间洛伦茨曲线呈显著的内凹型,且基尼系数大于0.5,表明信息流距离衰减集中度较高。映射出在导引现实旅游客流的流量和流向时,考虑本地和经济发达地区访问者需求的必要性。3)各旅游网站的空间洛伦茨曲线的弯曲程度存在一定差异,且基尼系数大小不同,表明其距离衰减的集中度存在差异,各省份旅游网站信息使用强度与信息流距离衰减集中度无明显相关性。这为旅游网站所在地旅游产业发展提供了一定的指导。

旅游网站;信息流;峰值衰减形态;距离衰减集中度

0 引言

随着信息经济地理学研究的不断深入,地理虚拟空间已成为备受关注的热点研究领域,尤其是网站信息流及其距离衰减更被作为经典理论问题对待。回顾国外文献可见网站信息流的研究已进入通过模型进行精准研究的阶段。例如,Skadberg等[1]研究了网站访问者浏览与网站吸引力效用之间的关系,并构建了信息流模型;Davidson等[2]以西方旅游者的视角对台湾相关的36个“名牌”旅游网站进行了事件分析,指出网站信息流具有为现实旅游者提供导引的潜力;Lexhagen[3]的研究建立了消费者决策过程模型,发现旅游网站信息流在顾客搜索和购买阶段非常重要;Kannan等[4]从互联网信息传输距离及使用价值对信息支付费用的影响入手论述了信息网络传输,发现信息流与现实空间存在多种关系,距离延伸产生的不断衰减仅是其中一种表现形式; Lu等[5]利用智能决策模型分析了网站信息流对现实人流的影响,指出网站信息流对现实人流具有增强和替代作用;A ntonellis等[6]通过实验建立了适用于数据处理的点击流数据聚类新模型。国内针对网络空间信息流距离衰减的理论及实证研究也取得一定进展,学者们探讨了信息流传输的影响因素、距离衰减的形态及研究方法等。邵隽等[7]研究了 Web点击流数据的特性,介绍了Web点击流数据分析在旅游研究中的价值;李彦丽等[8]通过比较影响中美旅游网站使用者决策的空间距离因素,提出了“虚拟距离衰减”的概念,并构建出使用者数量与虚拟距离衰减之间的关系模型,同时证实了基于访问者角度研究网站信息流距离衰减的有效性;路紫等[9]通过分析旅游网站访问者的时间分布,证明旅游网站虚拟访问量与旅游者人数间在部分时间和区域类型上具有相关性;孙中伟等[10]从地理学角度透视了流空间的基本性质;杜丽娟等[11]以留学网站、旅游网站及户外运动网站等专类网站为例,提出了信息流对人流的导引机理。综上所述,前人研究已从模型构建和实证视角描述了网站信息流及其距离衰减的现象,使网站信息流距离衰减研究进入探索距离衰减复杂性的新阶段,所建立的各种研究方法也为进一步的探讨奠定了基础。

本文选取了24个旅游网站访问量作为研究对象,首先利用origin软件对其进行多种模型模拟,旨在整体描述旅游网站信息流的距离衰减形态;然后借用区位熵、空间洛伦茨曲线、基尼系数3个指标,分析信息流距离衰减集中度的特征。这项研究既可以为区域旅游目标市场确定提供理论支持,也可以为旅游网站自身功能完善提供技术依据。

1 资料与方法

2007年9月15日至10月20日,通过“Baidu”、“Google”等搜索引擎,收集到国内24个旅游网站自建站以来至数据采集日期为止的访问量资料,这些资料覆盖全国31个省份;为了表述旅游网站信息使用强度的分省差异,应用中国指南针旅游网2009年11月发布的全国31个省份各种类型的5 640个旅游网站的点击量资料,作为各省份旅游网站信息流的流量强度。

采用区位熵指标可衡量网站信息流距离衰减集中程度[12],本文按照各省省会与网站所在省省会的实际地理距离的升序对各省份距离赋值为“31、30、29…2、1”;设各省份的赋值距离占总赋值距离的比重为 xi′,设各省份对某一网站的访问量占总访问量的比重为 yi′,可获得各省区位熵 qi=yi′/xi′。对区位熵进行升序排列后,计算出各省赋值距离累计百分比 Xk′,访问量累计百分比 Yk′,绘制各网站的空间洛伦茨曲线。根据公式可计算出各网站的基尼系数G,G值越大表示网站信息流距离衰减集中度越高。

2 旅游网站信息流距离衰减形态的描述

运用多种模型模拟旅游网站信息流距离衰减形态[13],发现高斯多峰模型和指数衰减模型模拟效果最好(表1)。表1显示:高斯多峰模型拟合中,20个网站的R2大于0.8,表明大多数网站拟合效果良好; 2个网站的 R2大于0.5小于0.8,表明基本符合。指数衰减模型拟合中,12个网站的 R2大于0.8,表明大多数网站拟合效果良好;3个网站的 R2大于0.5小于0.8,表明基本符合。这说明旅游网站信息流距离衰减主体上符合峰值衰减形态,其中包括指数衰减的单峰形态和高斯衰减的多峰形态。这一峰值衰减特征证实了地理距离在互联网时代的虚拟网络世界中仍然发挥着作用,它仍然是虚拟在线旅游发展的重要限制性因素,这与Choi[14]所认为的地理距离仍然是信息流传输先决条件的观点相符。

3 信息流距离衰减集中度的计算

3.1 区位熵的比较

依前文所述,对于特定旅游网站信息流距离衰减而言,某省的区位熵值大于1说明访问者在该省集中,比较旅游网站区位熵值大于1的省份具有明显意义:1)24个网站中有11个网站的区位熵最高值出现在网站所在省份,说明信息流距离衰减普遍具有本地集中性。2)区位熵排在前5位的省份存在明显的重叠现象,除网站所在省份外,广东出现频率为95.83%(23次),且有5次位居第一,上海出现频率为66.67%(16次),北京出现频率为54.17%(13次);另以区位熵值大于1比较,主要省份有广东(频率100%,24次)、北京(频率95.83%,23次)、上海(频率87.50%,21次)、浙江(频率62.50%,15次),说明旅游网站信息流不完全按照距离均等衰减,而是具有明显的经济集中性。3)上述旅游网站信息流距离衰减的空间集中性特征映射出潜在旅游客流的流量和流向特征,这既为旅游目的地目标市场基于本地和经济发达地区定位提供了理论依据,也为旅游目的地市场营销、产品开发以及线路组织提供了技术支持。此外,这一空间集中性特征也要求旅游网站应该基于本地访问者和经济发达地区访问者的需求完善自身功能与内容设置。

表1 各网站衰减形态拟合优度指数及基尼系数Table 1 Index of fitting goodness of attenuation patterns and Gini coefficient of websites

3.2 空间洛伦茨曲线与基尼系数的比较

3.2.1 旅游网站信息流距离衰减集中度整体较高

根据邵晖[15]的研究,空间洛伦茨曲线的弯曲程度越大,旅游网站信息流距离衰减集中度越大。从图1可以看出所有曲线呈内凹型,多数曲线与绝对均匀线相距较远,表明多数旅游网站的访问量在各省份的分布不均且集中度较高。为了量化描述集中度的状况,引入基尼系数指标[16]进行测评(表1),发现24个旅游网站中基尼系数大于0.5的有20个,介于0.4~0.5的有2个,这也说明多数旅游网站的访问量分省差距悬殊且集中度较高。可见,访问者地域结点的空间结构是信息流距离衰减曲线类型的决定性因素。上述特征与我国国内旅游客源空间分布不均衡性的事实比较吻合,因此潜在客流的研究可为我国区域旅游目标市场细分、旅游市场营销重点区域的确定提供理论指导。

3.2.2 旅游网站信息流距离衰减集中度不随使用强度而变化 从图1还可以看出,各网站的空间洛伦茨曲线弯曲程度不同,进而又从表1看出基尼系数最大值与最小值差距较大,说明信息流距离衰减集中度存在显著差异性。前人研究认为区域旅游网站发展规模与区域社会经济基础、网络技术基础背景及旅游发展的区域分异具有较大的一致性[17],因此旅游网站信息流集中于信息使用强度较大的区域,利用信息流距离衰减数据尝试对此进行验证。应用中国指南针旅游网发布的全国5 640个旅游网站的分省点击量数据,将其作为各省份对旅游网站信息使用的强度,又用24个旅游网站信息流距离衰减集中度的基尼系数代表该省份信息流距离衰减的集中度,将全国5 640个旅游网站分省点击量与24个旅游网站信息流距离衰减集中度的基尼系数绘制出双轴折线图(图2),从中看到各省份间随旅游网站信息使用强度减弱,基尼系数无明显规律。以上各旅游网站信息流距离衰减集中度的差异性特征,可为旅游网站所在地旅游业发展提供分类指导:集中度较高的旅游目的地应多关注其知名度和影响力以扩大市场范围,集中度较低的旅游目的地应多关注核心目标市场打造以确定重点客源区域。

图1 各旅游网站空间洛伦茨曲线Fig.1 Space Lorenz curve of every travel site

图2 24个旅游网站所在省份信息流距离衰减集中度的基尼系数与全国5 640个旅游网站分省点击量关系Fig.2 The relation between Gini coefficient of information flow distance decay concentration in 24 tourism websites and provincial visits of all tourism websites in China

4 结论

(1)24个旅游网站中有12个旅游网站指数衰减模型拟合效果良好,20个旅游网站高斯衰减模型拟合效果良好,表明总体上符合峰值衰减形态,又包括指数衰减的单峰形态和高斯衰减的多峰形态,其证实了地理距离在互联网时代的虚拟网络世界中仍然发挥着作用。

(2)区位熵值大于1的省份主要出现在网站所在省份或经济发达省份,表明其具有明显的本地集中性和经济集中性,映射出对潜在旅游客流的流量和流向的影响,为旅游目的地目标市场定位提供了理论支持;同时也对旅游网站完善自身功能、合理设置栏目以及正确展示内容提出了要求。

(3)多数旅游网站的空间洛伦茨曲线呈显著的内凹型,且其基尼系数较大,表明多数旅游网站访问量在各省份的分布不均匀、访问量分省差距悬殊,进一步证明了信息流距离衰减的集中现象,上述特征与现实旅游客源空间分布不均衡性基本一致,宏观上可为我国细分旅游目标市场、确定旅游营销重点提供参考。

(4)各旅游网站的空间洛伦茨曲线的弯曲程度和基尼系数大小不同,均表明距离衰减的集中度的差异性,反映出各旅游网站所在地旅游业发展的不同特征,对于距离衰减集中度较高的旅游目的地应重点扩大其知名度和影响力,对于距离衰减集中度较低的旅游目的地应重点打造其核心目标市场。

(5)随着信息流使用强度的减弱,旅游网站信息流距离衰减集中度无明显规律性,表明各省份对旅游网站信息的使用强度与该省旅游网站信息流距离衰减集中度无关,集中效应更具有现实意义,对旅游资源的开发、旅游营销策略、旅游品牌创建和区域合作关系建立都具有重要意义。

[1] SKADBERG Y X,SKADBERG A N,KIMMEL J R.Flow experience and its impact on the effectivenessof a tourism website[J].Information Technology&Tourism,2005,7(3-4):147-156.

[2] DAV IDSON A P,YU YM.The internetand theoccidental tourist: An analysis of Taiwan′s tourism websites from the perspective of western tourists[J].Information Technology&Tourism, 2005,7(2):91-102.

[3] LEXHAGEN M.The importanceof value-added services to support the customer search and purchase p rocess on travel websites [J].Information Technology and Tourism,2005,7(2):119-135.

[4] KANNAN R,RAY L,SARANGIS.The structure of information networks[J].Economic Theory,2007,30(1):119-134.

[5] LU Z,HAN R L,DUAN J,et al.Analyzing the effectof website information flow on realistic human flow using intelligent decision models[J].Know ledge-Based Systems,2010,23(1):40-47.

[6] ANTONELL IS P,MA KRIS C,TSIRA KIS N.Algorithm s for clustering clickstream data[J].Information Processing Letters, 2009,109(8):381-385.

[7] 邵隽,吴必虎.国外旅游研究领域Web点击流分析研究进展[J].地理与地理信息科学,2010,26(2):97-102.

[8] 李彦丽,路紫.中美旅游网站对比分析及“虚拟距离衰减”预测模式[J].人文地理,2006,21(6):115-118.

[9] 路紫,赵亚红,吴士锋,等.旅游网站访问者行为的时间分布及导引分析[J].地理学报,2007,62(2):621-630.

[10] 孙中伟,路紫.流空间基本性质的地理学透视[J].地理与地理信息科学,2005,21(1):109-112.

[11] 杜丽娟,张欣,路紫.国内网站信息流对人流导引作用机理研究综述[J].地理与地理信息科学,2008,24(4):84-87.

[12] PAULO G,OCTAV IO F,DOUGLASW.Dartboard tests for the location quotient[J].Regional Science and U rban Economics,2009,39(3):360-364.

[13] 金雪军,张学勇.中国典型旅游上市公司业绩与区域经济的关系[J].地理学报,2005,60(6):911-918.

[14] CHOI Y.The effect of social and physical distance on the global communication networks[J].Gazette,1994,54(2):163-192.

[15] 邵晖.北京市生产者服务业聚集特征[J].地理学报,2008,63 (12):1289-1298.

[16] 冒宇晨,王腊春.长三角城市群旅游经济结构的分散化和均质化趋势[J].地理科学,2009,29(5):641-645.

[17] 路紫,匙芳,王然,等.中国现实地理空间与虚拟网络空间的比较[J].地理科学,2008,28(5):601-606.

Abstract:In this paper,24 different tourism websiteswas selected by counting its visitors in every p rovince.Based on these data,the distance decay patterns were described by Origin software.Then,three indexes of location quotient,space Lorenz curve and Gini coefficient were used to study the concentration of its peak decay,and the concentration character of info rmation flow distance decay in tourism websites was summarized.A ll of these give a support to tourist destination defining and tourism websites building and marketing.The study showed that:1)Distance decay of tourism websites info rmation flow satisfies the peak decay mainly w hich includes the single-peak pattern of exponential decay and m ulti-peak fo rm of Gaussian decay.This can confirm geographic distance is also one of the limiting factorsof virtual tourism behavior.2)Provincesof that the location quotient greater than 1 are the site locationsor economically developed areas,this phenomenon reflects the local focus and economic concentration of info rmation flow in distance decay.Space Lorenz curve of most tourism websites are significantly concave and the Gini coefficients aremore than 0.5.It is indicate that distance decay concentration of info rmation flow is high,and reflect necessity of considering the visitors needs in local and economically developed area w hen guiding the quantity and direction of real tourist flow.3)Lorenz curves of various tourism websites are different in curvature and Gini coefficients are different in sizes. It is indicate that differencesare in their concentration of distance decay and there is no obvious relevance between the use intensity of tourism websites info rmation and its concentration of distance decay.

Key words:tourism websites;info rmation flow;peak decay pattern;concentration of distance decay

Description of Distance Decay Patterns of Tourism Websites Information Flow and Calculation of Its Concentration

YANG Xiao-yan,ZHANG Qiu-luan,LU Zi,ZHANG Xin,WANG Si-si
(Faculty of Tourism,College of Resource and Environment Sciences, Hebei N orm al University,Shijiazhuang 050016,China)

TP393.4;F590

A

1672-0504(2010)06-0088-04

2010-09-19;

2010-10-22

国家自然科学基金项目(40971073);河北省自然科学基金项目(D2010000419)

杨小彦(1986-),女,硕士研究生,研究方向为经济地理。*通讯作者E-mail:luzi@mail.hebtu.edu.cn

猜你喜欢

访问量信息流集中度
基于信息流的作战体系网络效能仿真与优化
新广告商:广告业周期性在弱化,而集中度在提升 精读
基于信息流的RBC系统外部通信网络故障分析
战区联合作战指挥信息流评价模型
高职院校图书馆电子资源中数据库的使用情况分析
保险公司资本结构、业务集中度与再保险需求研究
煤炭行业未来在提高集中度
如何做好搜索引擎优化(SEO)提高新闻网站访问量
如何做好搜索引擎优化(SEO)提高新闻网站访问量
一所大学有40人被确诊为抑郁症