APP下载

基于改进RFM模型与聚类算法的民航客户细分研究

2023-10-24王神武王梦杨

科技和产业 2023年19期
关键词:手肘细分航空公司

白 钊,王神武,王梦杨

(1.中国民用航空飞行学院 经济与管理学院,四川 广汉 618307;2.中国民用航空飞行学院 机场学院,四川 广汉 618307)

在传统的营销模式中,大部分企业会对市场进行详细的调查,针对客户已有产品的偏好进行相应的供需调整。但这种营销模式存在一定的误差性,会导致营销资源的浪费和营销效率低下。针对传统的营销模型,美国学者温德尔·史密斯在1956年就提出客户细分的理论,根据客户的行为价值和自身的优缺势来制定对应的营销策略来提高企业的收益,并在各个行业得到运用和发展[1]。在航空市场中,对于市场客户的细分已经有了一定的研究。赵崇希[2]尝试用RFMP模型和聚类算法对客户进行了细分,并为某企业制定了一套精准的营销策略;杨琳等[3]用改进的RFM模型和k-means算法对航空市场客户进行了分类,并针对各类航空客户提出了相应的营销策略;邢容[4]在2022年利用客户细分和客户关系管理理论,对客户关系发展、维护、流失管理策略进行了重构和优化。但还存在以下两个问题:

1)对于指标的选取。划分不同的客户群体时利用特定指标来进行聚类分析是整个客户群体划分过程中的重要部分,传统的RFM模型被广泛地运用在各个行业的客户价值评价,但在航空市场客户细分中,需要改进某些指标使航空市场细分更加具有针对性,便于在后续的营销和服务中进行差异化管理。

2)传统的k-means算法对于k值的选取一般是人为设定来进行聚类分析。由于是人为设定的k值,所以存在一定的主观性,对于聚类的分析过程存在一些人为性,会导致在后续制定营销计划时得不到预期的收益。

因此主要从以下两点来进行解决和改善:

1)对于RFM模型在航空市场中客户细分指标的针对性,选取的指标有:入会时间(T-time),指航空市场客户对于某个航司的第一次接触时间;会员级别(Level),是指某个客户在本航司的会员级别;订票总金额(Monetary),是指该会员在该航司消费的总金额;飞行次数(Frequency),是指某客户在该航司乘坐的次数,从而构建客户价值评价指标TLFM模型。

2)对于传统的k-means算法而言,初始k值的确定是通过人为主观进行确定。在本文中将采取自组织映射(self-organizing map,SOM)算法对所有的样本进行初次聚类,再对比“手肘法”来进行综合分析得到初始聚类k值。

1 模型与算法介绍

1.1 改进的RFM模型

RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段,在众多的客户关系管理(customer relationship management,CRM)的分析模式中,RFM模型应用最广泛[5]。RFM模型最早被提出是在1994年,Hughes[6]站在企业的角度来综合考量客户的购买行为的分析模型。主要是通过3个指标R(recency,客户最近一次的购买时间)、F(frequency,客户在某时间内的购买频率)、M(monetary,客户在某个时间段的消费总金额)来决定客户价值的高低。在民航市场客户价值的分析中,应该加以改进这3个指标,本文中所选取的是入会时间(T)、会员级别(L)、飞行次数(F)和订票总金额(M)这4个指标构建TLFM模型,利用k-means算法对U航空公司的多个变量进行聚类分析得到旅客的分类。

1.2 改进的k-means算法与SOM神经网络

k-means算法是指把数据的样本聚集成预定的聚类数,先在样本数据中随机抽取几个样本作为原始的聚类中心,然后通过距离的计算将最靠近聚类中心的数据点作为一类,在此基础上通过不断地迭代,根据迭代情况来更换聚类中心的值,直到收敛到最优的聚类中心,达到最合适的聚类结果[7]。对于聚类中心k值的确定在传统的k-means算法中,聚类数一般是需要预先给定,存在一定的人为主观性。因此在确定原始k值聚类中心的个数时需要根据数据进行判断。本文中综合运用自组织映射(SOM)神经网络和“手肘法”来确定初始k值。SOM神经网络是一种无导师学习方法,具有很好的自组织、可视化和简单聚类的特性,目前已经得到了学术界的广泛运用和研究[8]。

1.3 模型的构建

根据改进的RFM模型,通过SOM算法进行初步聚类并通过“手肘法”进行最佳k值的确定,将最佳k值代入算法中进行计算得到聚类结果。

SOM神经网络的基本步骤如下。

设x={x∈Rd}为d维样本向量的集合,A为所有神经元的集合,mi为第i个神经元的权重。

1)输出层的权值初始化。用小的随机数初始化权值。

2)在t时刻,随机加入一个样本记为X(xt)。

3)利用欧式距离计算得到当前的获胜节点C。此时获胜节点C为

C=min{‖x(t)-mi(t)‖,i∈A}

(1)

式中:mi(t)为在t时刻第i个神经元的权重。

4)对于权值的竞争训练。对于所有的神经元点,用下面的准则来进行更新:

(mi(t+1)=mi(t)+a(t)hci(t)d[x(t),mi(t)])

(2)

式中:a(t)为学习的步长;d[x(t),mi(t)]为两个向量之间的欧式距离;hci为节点i与节点c之间的近邻函数值;mi(t+1)为下一时刻第i个神经元的权重。

5)更新a(t)和领域NC(t)。若达到终止的要求,则算法停止;否则重置t=t+1重复上面的步骤。

用手肘法确定k值。手肘法是一种常规的k值确定的方法,其主要的步骤如下。

1)计算所有k值对应的误差平方和(sum of squared errors,SSE)。

式中:SSE为所有样本的聚类误差;X为某个样本;Ci为第i个质心;d(X,Ci)为样本到质心的距离。

2)利用工具制作SSE与k值对应关系折线图。

3)通过关系折线图找到最佳的k值。

根据SOM算法和手肘法确定最优值,将最优值作为最优k值代入k-means算法,其重要的步骤为:①确定最优k值(由SOM算法和手肘法确定);②计算样本到每个聚类中心的欧式距离;③根据计算得到样本到每一个聚类中心的欧式距离,距离最小的就归于某一类。

2 U航客户细分实例分析

2.1 数据获取

对U航空公司的客户进行细分,从U航空公司中随机抽取2019年1月1日至2019年6月30日6 000名客户的订票记录,其中包含会员编号、性别、入会时间、会员等级、飞行总里程、订票总金额和飞行次数等。从中选取TLFM模型所需要的会员编号、入会时间、订票总金额和飞行次数指标数据。

2.2 数据处理

由于原始数据具有噪声大、信息缺失和不一致的情况,需对原始数据进行清洗。将6 000条数据处理筛查之后得到4 520条数据。因数据量较大采用IBM SPSS Modeler来对数据进行进一步的处理,为了满足计算工具的需要将数据进行量化处理。具体的指标划分及量化情况见表1。

表1 指标划分及量化

对于SOM算法和k-means算法计算,由于各指标的单位不同可能会影响聚类结果,因此将量化之后的数据集利用spss进行标准化处理,表2为部分标准化之后的数据。

表2 部分标准化处理之后数据

2.3 算法实现

将数据使用MATLAB进行SOM算法计算得到第一次的简单聚类,共有13个,再计算所有k值对应的误差和SSE值得到对应关系折线图,如图1所示。

图1 “手肘法”折线图

通过观察折线图能观察到图中出现了二次较大的“肘处”,其分别是k=3和k=5处,对于k=5处其误差更小,因此根据手肘法所选取的最佳k值应该为5类。对于SOM算法简单聚类得到的聚类结果为13类,通过观察“手肘法”的折线图能看到当k=13时误差是相对于k=5更小的,但是在实际营销过程中,针对13类客户制定不同的营销策略会导致成本过大,因此最佳的k值可以选取为5,然后对于处理之后的数据利用k-means算法进行细分计算,将细分之后的群体定义为核心客户(A类)、高价值客户(B类)、次价值客户(C类)、重要客户(D类)和一般客户(E类)。客户特征雷达图如图2所示。

2.4 结果分析

根据图2可知,客户群体1的所有指标属性都较低,因此将其定义为一般客户(D类);客户群体2的T、L和F指标属性都较高,但出行次数不是特别高,因将其定义为高价值客户(B类);客户群体3的L、F和M的指标属性和第一类较相似,但属于航空公司的老客户,可能在这个时间段乘坐较少,因此将其定义为重要客户(D类);客户群体4相较于群体2只有T偏低一点,可以定义为次价值客户(C类);客户群体5所有指标属性都是最高的,因此将其定义为核心客户(A类)。客户的最终分类和聚类结果见表3。

表3 聚类结果

根据表3的聚类结果可以得到各类客户群中A类客户群体占据5.8%,其他各类占比分别为16.3%、6.4%、37.6%和33.4%,具体各类客户群体占比如图3所示。

图3 客户种类占比

通过聚类结果和各类客户群体的指标属性,航空公司可针对客户细分的结果来制定相应的营销策略和提供差异性的服务[4]。

3 客户细分结果分析及建议

核心客户(A类)只占5.8%,但能带来27.7%的收益。此类客户消费频率较高,在半年时间里平均消费次数达到了30次,人均消费了3.82万元,且这类客户入会的时间较长,客户的黏性较大;同时这类客户会员级别也很高,主要以白金卡和金卡会员为主。因此航空公司对于A类客户应该视为优先考虑的对象,针对这类客户需要差异化管理,多与客户沟通获取客户的需求,如为这类客户提供地面和空中VIP服务、开辟绿色通道减少候机时间和在空中增加智能点餐和免费电影点播等差异性服务,由此使这类客户对航空公司的满意度和忠诚度得到保持和提高。

高价值客户(B类)占据总客户的16.3%,能为航空公司带来30%的收益,这类客户半年内的人均消费达到了1.5万元,平均出行次数为12次,并且大部分客户入会时间都相对较长,主要以金卡会员为主。这类客户是航空公司的中坚力量,同样需要有一定的“特权”,如提供准点高效的航班和行李托运差异化等方式来加强这类客户对公司的信任度,延长B类客户的生命周期。

次价值客户(C类)虽只占据总客户量的6.7%,却带来了10.4%的收益,并且半年内人均出行数达到了12.4次,但这类客户的入会时间较短,是具有优质的潜力客户,航空公司需要投入一部分的资源,如提供更多的购买渠道和较大的商品折扣来吸引这类客户成为自己的忠实客户。

重要客户(D类)占据总客户的37.7%,却只能为公司带来19.2%的收益,人均出行量4.1次,但从客户入会时间来看,时间较长。因此对于这类客户应该在保持原有的基础上增加和老客户的沟通,推出一些反馈老客户的活动,如赠送一些纪念品、周年折扣票等来避免客户的流失。

一般客户(E类)占据33.4%,给航空公司带来的收益只占12.7%,这类客户人群占比较多,一般为冲动型消费人群,在较大的折扣机票时会选择出行。因此对于这类人均消费较低、出行频次低的客户可提供一些团队购票的活动去吸引出行或者提高客座率。

4 总结

首先分析传统的营销模式和客户细分的特点,并对比民航企业与传统行业客户细分的区别提出了TLFM模型。随后采取k-means算法对客户进行细分,在k-means算法中最佳k值采取了“手肘法”和SOM算法来进行确定,SOM算法主要是对原始数据进行初次聚类,“手肘法”主要是计算所有的k值来观察对应的误差,最终通过SOM算法和“手肘法”共同确定最佳的k值,从而将航空市场客户细分为核心客户(A类)、高价值客户(B类)、次价值客户(C类)、重要客户(D类)和一般客户(E类)这5类,并对这5类客户进行分析和解释,给航空公司提供了对应的营销策略和改进的方法。这些策略不仅能提升航空公司的收益,而且还能提高航空公司在竞争激烈的民航企业中保持自己的竞争力。

猜你喜欢

手肘细分航空公司
航空公司的低成本战略及其实施对策探讨
IATA上调2021年航空公司净亏损预测
深耕环保细分领域,维尔利为环保注入新动力
航空公司客票直销的现状与分析
1~7月,我国货车各细分市场均有增长
简历
整体低迷难掩细分市场亮点
纸媒新希望 看新型报纸如何细分市场逆势上扬