APP下载

基于时间序列分析的第三方支付行为研究

2019-05-20杜瑜琦李新月李晶晶

经营者 2019年7期
关键词:时间序列分析聚类算法相关性分析

杜瑜琦 李新月 李晶晶

摘 要 研究城市乘车人的出行支付特征,就需要从他们的出行数据进行分析。首先,运用K-means聚类算法对数据进行处理,再使用MATLAB等软件进行时间序列分析,并对支付方式和出行方式进行相关性分析,从不同角度、不同侧重点总结乘车人的出行支付特征。

关键词 K-means 聚类算法 时间序列分析 相关性分析

一、引言

随着移动支付的普及,现金在我们日常生活中的出现频率大幅降低。在公共交通领域,移动支付却并没有完全走进人们的生活。本文意在通过调查与数据分析了解大众对公交移动支付的态度以及出行支付方式的变化趋势,了解大众的移动支付特征。

二、问题分析

要对城市乘车人的出行支付特征进行分析,首先可以运用K-means聚类算法剔除数据中的缺失与错误值,而后使用EXCEL等软件进行时间序列分析,再运用SPSS对支付方式和出行方式进行相关性分析,得出基于不同角度和不同侧重点的城市人群出行支付特征。

三、问题的建模与求解

针对乘车人的出行支付特征的问题,可以利用乘车人的支付信息和数据,从时间与支付方式以及出行方式与支付方式两个方向进行统计分析。首先通过时间序列分析得到支付方式的比例随时间的变化趋势,判断其是否具有周期特征;再利用相关性分析,判断乘车人的出行方式是否影响支付手段。

(一)支付方式的时间序列分析

随机选取某一天的数据进行处理,以00:00为起点,以2小时为单位,将一天划分为12个等距区间,统计每个区间内选择移动支付的客流量总数。结果如图1所示。

由图1可见,乘车人的出行时间密度图呈左偏态分布。15:00~

17:59是出行数量最高的时间段,凌晨0:00~5:59阶段公交地铁出行量数据对于整体数据来说几乎等于不存在。

由于原始数据量庞大而处理过后数据较少,因此使用高斯噪声将原始图像加噪,结果如图2所示。

同时随机选取一年中2、5、8、11月中的每月7天的数据,统计共28天支付方式占总体的比例,运用MATLAB进行曲线拟合和自相关分析,结果如图3所示。

通过拟合曲线函数图可看出在总体调查的一年时间内呈递减趋势,数据点也随着时间的变化愈发的贴近拟合曲线;通过自相关图可以看出数据在1~7天,存在自相关系数大于0.02为非平稳序列;从第8天起为平稳序列。所以,乘车人对移动支付的偏好降低。造成这种现象的原因是:机器未及时进行检修,导致乘车人刷卡故障。

(二)相关性分析模型

运用SPSS针对出行方式(公交、地铁)与支付方式进行相关性分析,结果如下表1所示。

由表1看出,支付方式与出行方式相关,但非线性相关,即二者存在其他的非线性关系。通过比较两种出行方式与支付方式的显著性,发现地铁出行与支付方式存在更强烈的相关关系。

四、结语

一是乘车人的出行密度是根据乘车人们日常作息时间进行合理性波动的。乘车人的出行支付特征具有显著的周期性,以七天为周期波动;峰值往往出现于一个周期的后半期;二是出行方式与支付方式并无线性相关关系,但存在相关性。当乘车人选择地铁出行时,他的支付方式受出行方式影响程度更为强烈。

(杜瑜琦、李新月单位为华北理工大学经济学院;李晶晶单位为华北理工大学管理学院)

参考文献

[1] 崔喬.基于MATLAB的图像灰度分析及高斯白噪声的研究[J].科技创新与应用,2018(27):60-61.

猜你喜欢

时间序列分析聚类算法相关性分析
K—Means聚类算法在MapReduce框架下的实现
基于K?均值与AGNES聚类算法的校园网行为分析系统研究
基于R软件的金融时间序列的预测分析
上市公司财务指标与股票价格的相关性实证分析
淘宝星店成长中的粉丝力量
中国城市化与经济发展水平关系研究
基于改进的K_means算法在图像分割中的应用
大规模风电场集中接入对电力系统小干扰稳定的影响分析
微信公众号未来发展态势的实证预测
中国石化产业产能过剩测度及预警