APP下载

网络拼车成功的因素分析

2013-04-08谭家美朱丽叶南香兰侯立文

上海海事大学学报 2013年2期
关键词:拼车因变量效应

谭家美,朱丽叶,南香兰,侯立文

(上海海事大学 交通运输学院,上海 201306)

0 引 言

在国外,拼车有几种不同的说法,其中常用的有carpool, ridesharing, carsharing, sluggish等.正式意义上的拼车起源于1982年美国的旧金山,后来逐渐扩散到西雅图、华盛顿、休斯顿等城市,形成主流行为.随后发生的SMART计划也为拼车的实施提供帮助.1914年,随着美国经济的崩溃,出现类似于拼车的商业行为,为正式拼车奠定基础.由于拼车既有利于环保[1],又有利于缓解拥挤的城市交通[2],世界上许多国家用各种方式鼓励和支持拼车行为.

为了提高拼车参与率,国内外许多学者从不同层面研究影响拼车行为的各种因素.王茂福[3]分析拼车行为的积极效应,如节约成本、增进社会成员之间的沟通、降低交通拥堵、减少碳气体排放等.BURRI等[4]分析得出25~34岁年龄段的频繁出行次数,具有专业职位或者管理层职位时更倾向于参加拼车,但家庭收入在25 000~35 000美元之间的拼车行为明显降低.FERGUSON[5]通过研究1970—1990年间拼车的变化,指出每个家庭可用汽车数量的增加和更高的教育程度影响美国的拼车参与率,年龄、性别、家庭收入、生活习惯、种族多样化和相对贫困现象对拼车影响较小.LEVIN[6]则分析指出女性最不愿意被安排为司机,而男性最不喜欢一直当乘客,这些倾向影响到拼车.SCHEINER等[7]通过研究指出拼车激励是拼车参与者人数增加的重要原因.LI等[8]研究得出拼车参与者选择拼车的最重要原因就是可以使用HOV道路,其次才是节省时间、保护环境、减少费用等原因.JACOBS[9]通过分析得出:拼车时每增加一个车内人员,奖励25分的实验组表现出拼车行为的持续增加,而任何奖励措施都没有的控制组则没有变化.由于拼车对社会的积极效应使得国外诸多国家对拼车大力支持和鼓励,各种激励措施以及拼车行为自身产生的积极效应促使人们纷纷加入拼车者的行列.另外,还有针对有效拼车配对系统依据数学模型进行研究,提出拼车行为最优化建议.

上述文献从不同角度分析影响拼车行为的各种因素,并考虑提高拼车参与度.但是很少有文献涉及到网上拼车系统的分析及建议,当前国内针对拼车的文献也主要集中在法律法规层面上.本文结合以上文献所提供的信息分析影响互联网上拼车行为成功以及拼车效率的因素和影响强度,通过分析得到如何更有效地提高拼车成功的可能性,希望对现阶段拼车网站的建设提供参考依据.

1 国内外拼车网站比较

拼车的概念刚刚引入中国时互联网已经在国内稳定发展,因此大部分人一开始就可以通过拼车网站寻找拼友.随着互联网的发展,我国开始逐渐形成多样的拼车文化,越来越多的拼车依赖于拼车网站.现在北京、上海、广州等大城市的上班族都愿意通过拼车网寻找车友进行拼车.拼车的流行,很大程度上依赖于各个拼车网的发展.

近年来,随着拼车人数越来越多,各类拼车网站随之产生.国内拼车网站在发展时间上落后于国外,但在数量上却远远多于国外.这些网站为用户提供发布拼车信息、查找拼车信息的平台:如国内主要的网站有拼车啦(http://www.pinchela.com/),网站上发布各种拼车信息;51拼车网(www.51pinche.cn),为5大城市提供服务;AA拼车网(http://www.aapinche.com/),立足于各大城市,网站上的信息,除了发布基本的拼车信息外,还包括各类拼车信息以及相关信息的统计;拼车网(http://www.pcwcn.com/)可以在全国范围内进行拼车.还有一些网站开出专门的拼车频道:如百姓网(http://www.baixing.com/),赶集网(http://www.ganji.com/index.htm),58同城(www.58.com/pinche/)等,这些拼车频道每天更新数千条拼车网友的拼车信息.拼车网站与拼车频道的发展使得信息的流通更快,信息量更大.

拼车网站主要为用户提供一种平台,可以让用户提出自己的拼车路线和要求,也可以让他们用一定的方式寻找其他人的拼车路线.作为一个平台,拼车网站既不会干涉拼车的匹配,也无法提供任何保障.拼车的具体匹配交给用户自行完成.

通过对国内外两家主要拼车网站的比较发现,在功能设计方面没有明显差异,甚至国内的拼车网在信息互动方面还要强于国外的拼车网站,影响国内外拼车活跃度不同的主要原因很可能是国内外对拼车的关注度不同.另外,虽然目前在国内拼车有需求也有市场,但却无法纳入合理合法的轨道,事实上,国内很多法律法规始终挣扎于如何区分“拼车”与黑车的问题上.

国内共有几百家拼车网站或者拼车频道,为出行人员提供寻找拼车伙伴的平台,但经过调查发现其中大部分网站已失去足够的活跃度.研究拼车网站能够对拼车网站的发展有一定帮助,提高拼车参与率,这为个人和整个社会都会带来一定的积极效应.[10-13]

2 影响拼车的因素提取

拼车通常出现在上下班、接送孩子上下学、旅游、过年过节回家、长途出行等时间段.当前,寻找拼车伙伴主要有以下3种方式:(1)熟悉环境下(如亲人、朋友、邻居)的自发拼车,相互主动提供方便;(2)通过论坛、网络社区、微博等方式寻找与自己出行路线相同或相近的人一起拼车;(3)在网上发布自己的出发时间、出行路线、出行目的地、联系方式等,等待其他未知拼友的联系.本文针对第3种拼车方式进行研究.

在研究拼车问题的过程中,影响拼车的部分因素[14]逐渐被筛选出来,其中一部分是分析影响拼车的社会人口统计因素,如性别、年龄、教育程度、职业、收入等;另一方面是具体的出行影响因素,如拼车线路特点、出发地点、出发时间、出行距离、出行时间和拼车费用等.拼车影响因素的提取需要考虑拼车信息发布者和拼车参与者的各种社会人口统计因素特点,同时在选择拼车同伴时有些人会更倾向于选择同性或者异性,例如有些女性更喜欢跟同性一起拼车,感觉安全或者更方便交流.因此,性别可能是影响拼车成功的因素之一.事实上,主观因素[15]对拼车行为也会产生影响,如个人对拼车行为的态度、拼车的方便性、拼车人的可信度、个人对拼车的适应程度、与拼车同伴的熟悉程度等.

2.1 数据收集与描述

本文分析所采集的数据主要来源于国内外几个重要的拼车网站或者网站的拼车频道针对拼车信息的发布,基本上分为以下两种方式:一是拼车类型,如上下班通勤拼车、长途出行拼车、旅游拼车、其他目的拼车;二是拼车途经地点分类,通过途经地点的细化,使拼车信息匹配更加方便快捷.

首先提取网上拼车时影响拼车成功率和拼车次数的主要因素,包括将拼车信息发布者的年龄、性别、出行线路、出发时间等基本信息作为数据分析的主要变量;然后从拼车网站收集和筛选变量对应的数据,并将有效数据进一步整理,利用回归模型和DOE分析有效数据,最后筛选出影响拼车成功率和拼车申请次数的主要影响因素.

通过对某拼车网站的拼车历史记录的初步收集,得到近25 000条拼车历史记录.将网站上采集到的数据保存到数据表中,数据表的主要字段包括Id,Name,Gender,Origin,Destination,Depart_time,Arrive_time,Timewindow,Has_car,Passed,Invite,Apply,Reply,Click,Price.表1是针对原始数据主要字段变量的说明.

表1 原始数据主要字段变量的描述

2.2 数据处理

收集原始数据后,对数据作进一步处理,删除无法识别的数据(当数据中出现大量异常值时,也无法采用).原始数据中还包含有很多信息是黑车揽客的广告,当这些黑车信息非常明显时,即删除该无效数据.

经过初步数据处理,最终得到有效数据.将这部分有效数据划分为两种类型:一种是4 002条有效拼车数据,10个可以直接应用到分析中的变量,但是不包括价格变量;另外一种是1 000条有效拼车数据,11个可以直接应用到分析中的变量,包含价格变量.部分字段的数据以文本形式存在,如出发地点、到达地点、出发时间和到达时间,需要将这些文本数据转换为一系列可分析的数据形式,见表2.

3 模型计算

3.1 影响因素的交互效应分析

试验设计,是一种安排试验和分析试验数据的数理统计方法.试验设计主要是对试验进行合理安排,以较小的试验规模或者较少的试验次数、较短的试验周期和较低的试验成本获得理想的试验结果并得出合理结论.

表2 变量描述统计

根据处理完毕的有效数据进行试验设计,分别将表2中变量的水平值划分为低水平和高水平.该划分依据对各变量的观察,确定出各变量的水平临界值.例如,变量T的水平临界值为55,低于55的为低水平,其余的为高水平.本次试验拟合整个模型,包括10个主效应,43个双因子交互作用,其中“R”和“R*C”的主效应显著,其p值(用于判断交互作用的显著性)分别为0.004和0.000. “R”和“R*C”交互作用的效应显著(见图1~4).

图1 标准化效应的正态图

图2 标准化效应的半正态图

从主效应图4上可以看出G对Ap的影响最小,R和C对Ap的影响最大,其次为其他因素.交互作用图(见图5)显示更改一个因子的设置对另一个因子的影响.由于交互作用可以放大或缩小主效应,因此评估交互作用极其重要.从图中可以看出,除了V,O,D,T交互作用很弱甚至没有外,Pr与D,R,C,H,Pa的交互影响也很弱或者没有,交互作用比较显著的有T与R.

图3 标准化效应的Pareto图

图4 Ap主效应图

图5 Ap交互作用

R对申请人数Ap产生很大影响,而在Ap的效应和因数的估计图中,C显示的p值为0.804,在主效应图中,显示C对Ap的影响很大,几乎与R相当.而在双因子交互作用中,表现最明显的就是R*C.对Ap影响最小的为因子G,即发起人性别,由图5可以看到,G对其他因子的影响也很小.

3.2 影响因素的回归分析

设定Ap(对该拼车信息提出申请的人数)为因变量,其他9项为自变量,分别对上述两种数据进行回归分析.首先针对没有包含价格变量的4 002条有效数据进行回归,其次针对包含有价格变量的数据进行回归.回归分析使用的软件是Minitab 15,计算结果见表3和4.

表3 以Ap为因变量的回归结果分析

表4 方差分析

表3中,S是回归模型误差的标准方差.R-Sq是回归模型误差占总误差的百分比,取值在0和100%之间;取值越大,表明回归模型与数据吻合越好.(R-Sq)adj是调整后的R-Sq,取值也在0和100%之间,与R-Sq越接近,表明回归模型越可靠.表4中,F表示组间均方与组内均方的比例.

由此得到回归方程

Ap=0.647 0-0.049 5G-0.038 9O+0.050 8D+0.000 002T+0.015 6V+0.248 7R+

0.010 7C+0.136 4H-0.009 1Pa

可以看出所有自变量中只有R和C对因变量Ap影响显著,进一步分析影响不显著的分类数据,将G和H分别与影响显著的非分类数据R和C相乘,得到4个新的变量G_R,G_C,H_R,H_C分别进行回归分析.结果表明4个新变量均对因变量Ap影响显著,有些甚至影响到其他自变量对因变量的影响程度,原有影响不显著的变成影响显著.4个新变量中对其他自变量影响最显著的为H_C,计算结果见表5和6.

由表5和6可以看出5个自变量O,R,C,H,H-C对因变量Ap影响显著.对包含价格变量的数据进行回归分析,Ap为因变量、其他10项为自变量的结果显示:V,R,C和Pr等4个自变量对因变量Ap影响显著.同样,尝试将影响不显著的分类数据G和H分别与影响显著的非分类数据V,R,C,Pr相乘,得到8个新的变量G_V,G_R,G_C,G_Pr,H_V,H_R,H_C,H_Pr.将这8个变量分别加到已有的10个自变量,分别用1个因变量和11个自变量进行回归分析.结果表明8个新变量中只有一项G_R对因变量Ap影响显著.

表5 H-C的影响分析

表6 方差分析

通过上述分析,可以得出以下结论:回复数与点击数对拼车成功率有正面影响;当不考虑价格因素时,拼车信息发布人的性别和是否有车会间接影响拼车成功率;考虑价格因素时,拼车信息发布人的性别间接影响回复数对拼车成功率的影响.因此,提高点击数和回复数可以提高拼车成功率.对于拼车网站而言,可以采取适当的鼓励措施提高点击数和回复数,从而增强网站的活跃度.国内外已有文献研究过拼车的鼓励措施,有些国家甚至成立拼车组织,例如德国设立的“拼车中心”“ 拼车协会”“ 拼车俱乐部”等.

3.3 模型结果解释

根据上述计算结果可以看出,所有不同自变量的情况下,无论有没有价格变量,回复数和点击数均对报名人数有显著影响,这意味着拼车的报名人数与其拼车信息的关注度,即点击数和回复数成正比.当考虑到价格因素时,价格和邀请人数也变成影响显著的因素,价格越低,邀请人数越多,拼车报名人数也越多.拼车发起人的性别和是否有车这两种分类变量均间接地影响到回复数和点击数对报名人数的影响程度.在所有因子中,性别是被考虑得最少的因素.这些说明拼车者在寻找伙伴的过程中,首先考虑到拼车信息的受欢迎程度,然后是这条拼车信息的实际内容,最后关注的才是拼车对象的性别问题.

4 结束语

针对互联网的拼车行为,分析拼车网站或拼车频道的信息规范问题.通过分析了解在网络中拼车伙伴成功配对的影响因素和影响强度,利用分析结果为拼车网站的规范化和持续发展提供参考依据.

在实际的拼车网站中,即使了解回复数和点击数的重要性,也难以确保这两个数据的真实性和有效性.在互联网发展的过程中,不可避免地会产生各种水帖和黑车信息,网站应尽量保持回帖的可利用性并及时排除黑车信息,以提高拼车匹配成功率.

参考文献:

[1] 王正. 交通战略规划的特征研究[J]. 上海海运学院学报, 2001, 22(4): 19-22.

[2] 张春平, 黄敏, 杨东援. 深圳市智能运输系统建设机制分析[J]. 上海海运学院学报, 2001, 22(1): 29-34.

[3] 王茂福. 拼车的发展及其效应[J]. 中国软科学, 2010(11): 54-61.

[4] BURRI M W, WINN J R. Slugging in Houston: casual carpool passenger characteristics[J]. J Public Transportation, 2006, 9(5): 23-40.

[5] FERGUSON E. The rise and fall of the American carpool: 1970-1990[J]. Transportation, 1997, 24(4): 349-376.

[6] LEVIN I P. Measuring tradeoffs in carpool driving arrangement preference[J]. Transportation, 1982, 11(1): 71-85.

[7] SCHEINER J I, KEIPER S A. Carpool information project: innovative approaches improve results[J]. Transportation Res Rec, 1979(619): 16-18.

[8] LI Jianling, EMBRY P. Who chooses to carpool and why: examination of Texas carpoolers[J].Transportation Res Rec, 2007(2021): 110-117.

[9] JACOBS H E. Multiple incentives in encouraging carpool formation on a university campus[J]. J Applied Behavior Anal, 1982, 15(1):141-149.

[10] 丁洁蓉. 我国“拼车”合法化的法律思考[J]. 浙江万里学院学报, 2009, 22(6): 56-60.

[11] 刘洲. 个人自由与政府干预——基于“拼车”现象的法律分析[J]. 生产力研究, 2009, 9(24): 18-20.

[12] 吴润元. 对私车拼车载客现象的分析和思考[J]. 交通与运输, 2007 (5): 15-16.

[13] 周泽强. 拼车的法律分析及规制建议[J]. 福建法学, 2010(3): 8-11.

[14] KAMAR E, HORVITZ E. Collaboration and shared plans in the open world: studies of ridesharing[C] // 21st Int Joint Conf Artificial Intelligence, Proc, 2009: 187-194.

[15] 郑士源. 合作博弈理论的研究进展——联盟的形成机制及稳定性研究综述[J]. 上海海事大学学报, 2011, 32(4): 53-59.

猜你喜欢

拼车因变量效应
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
铀对大型溞的急性毒性效应
懒马效应
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
偏最小二乘回归方法
应变效应及其应用
基于Web的拼车系统的设计与实现
Uber不守规矩,拼车成了一件生死攸关的事情
这个叫作拼车的饥饿游戏
拼车的饥饿游戏:这个叫作拼车的饥饿游戏