APP下载

基于层次分析与多元曲线拟合法的众包任务定价模型研究

2018-11-16何洪亮王子群娄贵红

软件 2018年10期
关键词:经纬度完成率定价

何洪亮,赵 珂,王子群,娄贵红



基于层次分析与多元曲线拟合法的众包任务定价模型研究

何洪亮,赵 珂*,王子群,娄贵红

(昆明理工大学城市学院,云南 昆明 650051)

作为影响众包任务完成率的重要因素,众包任务定价受到众包任务决策者的高度关注,成为了众包过程中的重要难题。针对众包任务定价过低将直接导致任务接单率低下,而任务定价过高则会增加任务发布者的支出成本的定价难题,本文提出了一种基于层次分析法和多元曲线拟合法的众包任务定价模型,研究了会员密度、会员至任务之间的距离、任务地理位置、经济发展水平以及交通情况五个主要因素对众包任务定价的影响情况,并通过概率统计分析论证了众包任务定价与任务完成率之间的线性关系,为提高众包任务完成率提供了理论方法。实验表明该模型适用于各类任务发布地区,具有普遍的适用性,能够帮助决策者制定出合理的任务定价方案。

众包任务完成率;层次分析法;多元曲线拟合;定价模型

0 引言

随着经济全球化和网络科学技术的发展,近年来以自由、开放、创新、共赢等作为主要特点的众包模式受到了国内外企业的欢迎。众包模式对企业起到降低成本、提高生产效率、优化企业结构和提高公司竞争力的作用[1-2]。美国《连线》杂志记者杰夫·豪(Jeff•Howe)在2006年6月首次提出了众包的概念:指一个机构或公司把过去由正式员工执行的任务,以自由、自愿的形式外包给非特定的网络大众去完成的做法[3-4]。众包模式包括任务发布者、众包平台和任务执行者三大主体,由任务发布者通过众包平台发布需要被完成的众包任务并设定任务的价格,由大众网民构成的任务执行者来接单完成任务并获取相应的酬金,众包平台是整个众包模式的中间枢纽[5-6]。

众包任务定价作为影响任务完成率的重要因素,受到了任务自身属性、任务发布地经济水平、交通水平、会员密集程度等因素的影响。历史研究中,Pengkun Wu等[7]提出了一种实时空间众包(RB-TPSC)任务包分配模型,其目标是提高任务完成率和最大限度地满足预期预算,该模型为任务寻找最佳的任务执行者同时考虑了针对不同任务执行者任务定价问题。陈逸凡等[8]研究了一种基于多元回归的众包任务定价规律,采用聚类方法为各个地区制定了针对性的定价模型。Umairul Hassan等[9]提出一种基于组合分数编程方法的距离可靠性比(DRR)算法,能最大限度地提高任务可靠性并最大限度地减少空间众包中的差旅费,以减小众包的支出成本,该算法可将价值成本降低80%。Chunyan Miao等[10]提出了一种用于空间众包的预算意识任务分配法(Budget-TASC),帮助决策者为(1)应向谁分配任务;(2)应向任务执行者付多少钱;(3)何时停止寻找额外的工作人员完成任务这三个问题提供了解决方案,其中的第二点研究了众包任务定价策略。

本文针对众包模式中的定价模型进行研究,重点对众包任务发布者新区首发任务和已发布任务地区的增发任务的不同的定价需求进行了相关探索,以得出更为合理的定价模型,既能充分保障任务发布者的经济利益,又可以提高众包任务的完成率。

1 众包任务定价对任务完成率的影响分析

1.1 数据取样和聚类分析

经过市场调查,本文选取集中分布于广州、深圳、东莞和佛山市四个地区的“拍照赚钱”众包任务数据进行研究,包括1877组会员数据和2901组任务数据。研究数据字段主要集中于:会员位置(经度信息和维度信息)、会员预定任务限额、任务经度信息、任务维度信息、任务标价和任务执行情况。

图1 众包任务地理位置图

众包任务完成情况除受任务定价影响外还受任务分布地的经济、交通以及人口密度等因素影响,为进一步研究不同因素对任务定价的影响情况,将众包任务分为已完成和未完成两类,利用MATLAB软件以经度和纬度为坐标将任务点和会员点绘制在图2中。

采用聚类分析法对各区域完成任务情况进行分析,可见已完成任务和未完成任务在不同区域的分布情况存在明显差异:A区会员密度较高任务完成率较低;B区会员密度低任务完成率较高;C区会员密度高任务完成率低;D区会员密度较低任务完成率高。

图2 众包任务分区图

1.2 众包任务定价与完成率的概率分析

(1)整体分析

综合考虑总体任务的数据信息,其中任务点的分布为离散变量,利用求取总体任务点价格的平均值和方差的方法来对任务定价进行离散概率研究,众包任务定价平均值、方差的计算公式如公式(1)、(2)所示。

为进一步准确分析出任务定价对任务完成情况的影响,引入任务完成率来表征任务定价对任务完成情况的影响程度,如公式(3)所示。

计算总体任务的定价平均值和定价方差,如表1所示。

表1 总体任务的定价平均值和定价方差

Tab.1 Pricing averages and variances for all tasks

(2)局部分析

在四个区域间比较定价平均值和任务完成率可得:区域的任务定价平均值越高,任务的完成率也越高。对各区域间进行比较分析之后,再对A、B、C、D四个区域进行内部分析,数据计算结果如表3-6所示。

表2 各区域的任务定价平均值和任务完成率

Tab.2 Average task price and task completion rate for each region

表3 A区域内部对比图

Tab.3 Internal comparison chart of area A

表4 B区域内部对比图

Tab.4 Internal comparison chart of area B

表5 C区域内部对比图

Tab.5 Internal comparison chart of area C

表6 D区域内部对比图

Tab.6 Internal comparison chart of area D

2 众包定价模型构建

经过1中的整体和局部分析均可知,任务定价是直接影响任务完成率的重要因素之一,任务定价的适当提高可增加任务的完成率,但任务定价过高又将直接增加决策者的投资成本,寻找到两者兼顾的合理定价是定价模型的关键。此外,众包任务定价直观上还受到任务点所处地理位置的影响,实际中地理位置因素对定价的影响程度是任务发布地经济水平、交通水平以及人口密度等因素综合作用的结果。

针对未曾发布过任务的新区域,决策者应当综合考虑经济水平、交通水平、人口密度、位置等因素对众包任务定价的影响,制定出合理定价以保证任务的完成率,对于发布了任务但未取得理想效果的区域也可当作该类新区域处理。针对已经发布了众包任务的地区,经济、交通水平、人口密度等因素短期内不会发生较大变化,众包任务决策者可参照该地区已取得理想效果的众包任务,直接据众包任务的经纬度变量为增发任务制定出合理定价。

2.1 基于层次分析法的新发任务定价策略

众包任务定价除了受自身经纬度影响外,同时还受到会员所处地经纬度的影响。对于新任务发布区域,已注册会员区与新任务区的距离是影响新发布任务完成率及完成效率的重要因素。若新任务发布区域之前没有会员积累,新发布任务需要等待该区域有会员积累后才可能被执行,这将严重影响任务的完成率。这种情况下,决策者在尽量减小新任务被执行的客观阻力的同时,应当采取新的任务定价方案,以增加已存在会员前往执行新发布任务的概率,提高新任务被执行的可能。

文献[12]总结了过去20年层次分析法取得的相关研究,指出了层次分析法灵活、广泛的实用性和主要应用领域。采用层次分析法研究众包任务定价同时受到任务经纬度和会员经纬度的影响,任务经纬度和会员经纬度对任务定价的影响程度是会员密度、任务距会员之间的距离、地理位置、当地经济发展水平以及交通情况综合作用的结果。构建层次分析图如图3所示。

图3 定价层次分析图

Step2:对平均随机一致性指标进行查找所得结果如表7所示。

表7 平均随机一致性指标

Tab.7 Average random agreement

表8 任务、会员经纬度与定价的成对比较矩阵

Tab.8 Pairwise comparison matrix between price and task location and membership location

同理可得C层各因素对B层任务经纬度和会员经纬度两个准则的权重。C层各个因素对会员经纬度和任务经纬度的权重结果分别如表9和表10所示。

根据C层各因素对B层因素的影响权重以及B层因素对O层因素的影响权重,可得到方案层对目标层的组合权向量为:

表9 C层各因素会员经纬度的成对比较矩阵

Tab.9 Pairwise comparison matrix between C-level factors and membership positions

表10 C层各因素任务经纬度的成对比较矩阵

Tab.10 Pairwise comparison matrix between C-level factors and task locations

并进行组合一致性检验,结果如公式(8)所示。

表11 各影响因素的权重

Tab.11 The weight of each influencing factor

可得任务发布地的会员密度、任务距会员之间的距离、地理位置、当地经济发展水平以及交通情况对任务定价的影响系数分别为0.1744、0.0630、0.1605、0.1639和0.4383,可见不同因素的影响系数各不相同,其中交通情况对任务定价的影响程度最大,距离因素对任务定价的影响程度最小。

由此决策者可充分调研不同地区的以上五个因素的实际数据,并与本文研究区域的数据进行比较,根据各影响因素的变化程度以及各影响因素所占权重系数来为已经发布未被执行或者还未发布的任务制定出合理的定价。

2.2 基于多元曲线拟合的增发任务定价策略

众包任务定价的直观影响因素是任务发布地的地理位置。对于已经取得理想效果的众包任务,发布者近期欲在该区域增发同类任务时,可直接根据任务点的经纬度以及每个任务的定价分析任务的定价规律。将任务点的地理位置经度和维度作为两个影响因素,基于多元曲线拟合[8]计算这两个影响因素对任务定价影响程度的权重系数,如公式(9)所示。

决策者在未知其他影响因素及其权重系数,欲在本区增发任务时,可依据公式(10),根据众包任务需发布的实际地理位置的经度和维度信息,制定出初步的任务定价方案,在首批任务获得反馈信息后再进行相应调整即可获得较理想的任务定价。

3 结论

本文通过对众包任务市场数据进行挖掘和分析,采用概率统计方法论证了任务定价和众包任务完成率之间的线性关系,采用层次分析法和多元曲线拟合构建了为新区首发任务和已取得理想结果地区增发任务定价的两种不同需求的众包任务定价模型。通过选取该地区2066组任务数据进行模型定价实验,无论是基于新发任务定价模型和已发布任务的增发任务定价模型都取得了较好的结果,其中通过新发任务定价模型制定定价的任务整体任务完成率达到了76.61%,而应用增发任务定价模型发布任务的整体任务完成率为71.27%,远大于原始完成率63.59%。实践应用证明本文提出的定价模型能有效激励众包市场,适用于不同的任务发布地区,能够帮助决策者制定出合理的定价方案、提高了任务完成率。但论文仅研究了影响定价的数个主要因素,未能研究影响定价的更多因素,可在未来的研究工作中继续完善。

[1] 张利斌, 钟复平, 涂慧. 众包问题研究综述[J]. 科技进步与对策, 2012, 29(06): 154-160.

[2] 冯剑红, 李国良, 冯建华.众包技术研究综述[J]. 计算机学报, 2015, 38(9): 1713-1726.

[3] Howe J.The rise of crowdsourcing.Wired magazine, 2006, 14(6): 1-4.

[4] Howe J. Crowdsourcing. New York: Crown Publishing Group. 2008.

[5] 赵江华, 穆舒婷, 王学志, 等.科学数据众包处理研究[J].计算机研究与发展, 2017, 54(2): 284-294.

[6] 严宏基, 李兵, 詹伟, 等.基于众包模式的POI数据采集方案研究[J].地理空间信息, 2017, 15(12): 41-44.

[7] Pengkun Wu,Eric W. T. Ngaib, Yuanyuan Wu. Toward a real-time and budget-aware task package allocation in spatial crowdsourcing[J]. Decision Support Systems[J]. 2018, 110: 107-117.

[8] 陈逸凡, 陈硕, 刘婉静, 等. 基于多元回归的众包平台定价规律研究[J]. 软件, 2017, 38(12): 279-282.

[9] Umairul Hassan,Edward Curry.Efficient task assignment for spatial crowdsourcing: A combinatorial fractional optimization approach with semi-banditlearning.Expert Systems With Applications[J]. 2016, 58: 36-56.

[10] Chunyan Miao, Han Yuc,Zhiqi Shena,Cyril Leung.Balancing quality and budget considerations in mobile crowdsourcing[J]. Decision Support Systems. 2016, 90: 56-64.

[11] 浦东平, 樊重俊, 袁光辉, 杨云鹏. 精英蜂群算法及考虑利益相关者的众包定价模型. 计算机应用研究. 2019, 36(5).

[12] Ho, Williama, Ma, Xin. The state-of-the-art integrations and applications of the analytic hierarchy process. European Journal of Operational Research. 2018, 267(2): 399-414.

[13] 金晓溪, 李义鑫, 潘泽旭. 互联网“自助劳务”众包平台下的定价模式研究[J]. 经营谋略, 2018, 1: 171-172.

[14] 盛骤, 谢式千, 潘承毅, 概率论与数理统计[M]. 浙江大学: 高等教育出版社, 2009.

[15] 陈瑞泽, 周正, 朱力. 众包平台的任务定价规律模型[J]. 经贸实践, 2017, 21: 308.

[16] 张瑾. 基于层次分析法的个人信息安全评估研究[J]. 价值工程, 2018, 5: 57.

Research on Crowdsourcing Task Pricing Model Based on Analytic Hierarchy Process and Multivariate Curve Fitting

HE Hong-liang, ZHAO Ke*, WANG Zi-qun, LOU Gui-hong

(City college, Kunming University of Science and Technology, Kunming 650051, China)

As an important factor affecting the completion rate of crowdsourcing tasks, crowdsourcing task pricing has been highly concerned by crowdsourcing task decision makers and has become an important problem in the crowdsourcing process.In order to solve the problem that low crowdsourcing task pricing will directly lead to low task ordering rate, and too high task pricing will increase the cost of task publishers. This paper proposes a crowdsourcing task pricing model based on analytic hierarchy process and multivariate curve fitting method, and studies the influence of five main factors on the pricing of crowdsourcing tasks. The five main factors are membership density, distance between members and tasks, mission location, economic development level and traffic conditions.Then, we use probabilistic statistical analysis to demonstrate the linear relationship between crowdsourcing task pricing and task completion rate.This paper provides a theoretical method for improving the completion rate of crowdsourcing tasks.Experiments show that the model is applicable to all kinds of task release areas, has universal applicability, and can help decision makers to develop a reasonable task pricing plan.

Crowdsourcing task completion rate; Analytic hierarchy process; Multivariate curve fitting; Pricing model

O212.1

A

10.3969/j.issn.1003-6970.2018.10.027

何洪亮(1996-),男,昆明理工大学本科生,主要研究方向:信号与信息处理、大数据挖掘。

赵珂(1978-),女,硕士,讲师,主要研究方向:信号与信息处理、大数据挖掘。

何洪亮,赵珂,王子群,等. 基于层次分析与多元曲线拟合法的众包任务定价模型研究[J]. 软件,2018,39(10):139-144

猜你喜欢

经纬度完成率定价
国有企业更容易“走出去”吗?——基于跨境并购完成率的分析
多措并举:洪雅联社提前完成6项指标
本刊2020年36卷第12期版权页定价勘误
关于提高航天型号计划完成率的思考
基于经纬度范围的多点任务打包算法
基于分层Copula的CDS定价研究
澳洲位移大,需调经纬度
帮爸爸定价
自主定价基本不可能