APP下载

无线网络满意度的数理统计建模分析*

2014-02-10谢岳通

通信技术 2014年10期
关键词:领先显著性变量

王 凯,谢岳通

(宁波移动,浙江宁波315040)

无线网络满意度的数理统计建模分析*

王 凯,谢岳通

(宁波移动,浙江宁波315040)

以网络满意度为核心的网络日常工作要求日益凸显,网络KPI(关键绩效指标)的提升对用户调研满意度的关联度影响是否明显,应该通过什么样的维度与手段能够找到网络满意度工作方向是电信运营商较为关心的重要课题。借助SPSS平台,通过回归分析,单因素方差分析等数理统计方法对网络满意度进行相关因素的关联规律挖掘,找到围绕用户感知的网络工作落脚点,得出网络满意度提升模型与方向的结论。

数理统计 回归分析 相关性 偏相关 方差 网络满意度

0 引 言

用户对无线网络的满意度,是运营商核心服务基础,网络运维工作的出发点就在于用户感知效果。为全面挖掘网络热点区域用户对网络质量满意度的真实感知,检测网络质量短板,要通过全地区及语音网络通话密集区域实施网络质量客户满意度调研,根据调研数据进行统计分析,建立有用的参数模型,确定围绕感知的网络运维重点。

1 日常数据分析方法的不足

在数据整合初期,我们使用象限与趋势图的分析方法,发现网络满意度与网络优化指标并不能一一对应。象限图中各点分布离散,仅能说明满意度与优化指标关联度不大。同时,象限坐标零点是根据总体数据的感知人为评估来定,准确性存在一定偏差。

根据坐标图分布,我们对落在各象限的区域进行逐步分析,分析方法主要为不满意用户的回访调研,统计出问题进行归类。对于满意度高的区域,归纳原因进行定性总结。总体来讲,缺乏精确方法的支撑,枚举归纳成为主要方法。

这种分析方法缺乏全面性,仅能对于区域问题进行提升方向的评估和建议,而对于整体满意度相关因素的影响度无法衡量。同样,对于聚类的挖掘也不一定能够得到有效的结论,在不同类型的数据中进行比较,均值与离散性也是不可忽视的重要指标,统计方法的应用非常必要。

2 研究对象与统计分析方法

2.1 研究对象

研究对象包含两类,A类对象为对本地36个话务数据热点区域的用户,集中完成热点区域的用户满意度打分调研,同时收集这些区域的网络语音性能指标、数据性能指标、现场测试语音指标、现场测试数据指标。表1为部分数据指标示例,总分为对用户影响的性能与测试数据加权得出。图1和图2为地区话音与数据的热点区域渲染分布。

表1 热点区域网络满意度与网络汇总指标Table 1 Integrated indicators of customer satisfaction of the key network and network KPI

图1 语音业务热点渲染区域Fig.1 Key areas of voice traffic hot spots

图2 数据业务热点渲染区域Fig.2 Key areas of data traffic hot spots

B类对象为随机抽取浙江省内移动用户,全年分四季度分别抽取300名用户进行满意度打分调研。同时,按照地市汇总区域领先度,各细项打分,作为相关性分析数据来源。表2和表3分别为B类对象用户打分指标示例。参照文献[1]用户感知评估方法,归类网络相关的四类细项,再通过统计方法完成与用户满意度相关联的统计评估。

表2 全省全年四期各地市调研成绩Table 2 4time/year investigation results of various cities in the province

表3 全省全年客户类调研打分Table 3 Customer investigation results of the whole province in 2012

2.2 本文所用统计分析方法

本文主要以数理统计分析方法为基础,通过相关性分析确定想要了解的指标间的关系,找到对网络满意度起决定性作用的细项。通过方差分析对比不同区域或者品牌类型对网络满意度的影响,并找到对目标因素影响最大的指标类型。通过多元回归分析,建立网络满意度数据模型。

相关分析是研究变量之间密切程度的一种常用的统计方法,线性相关研究两个变量之间线性相关的程度。相关系数是描述这种线性关系程度和方向的统计量,常用r来表示,r的取值范围从-1至1之间。如果相关系数大于0,说明二者正相关,即随着变大而变大,变小而变小,变化方向一致,若数字越接近1,说明高度相关。如果相关系数小于0,说明二者负相关,即随着变大而变小,变小而变大,变化方向相反,若数字接近-1,说明低度相关。

方差分析是通过分析研究不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小。通过方差分析不同水平的控制变量是否对结果产生了显著影响。如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然使结果有显著的变化;如果控制变量的不同水平对结果没有显著的影响,那么结果的变化主要由随机变量起作用,和控制变量关系不大。

多元回归主要是找出多个变量与目标变量的关系模型,一般一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,之前我们通过相关分析找出一些因素与满意度的相关性,对于那些都具备相关性的因素就可以考虑采用多元回归的方法建立模型。

2.2.1 网络指标相关性分析

关于网络满意度与网络性能、测试指标的相关性分析,是以A类对象进行调研与网络性能指标收集,得到分析数据。通过数理统计方法中的相关性分析,来确定用户对网络的满意度打分与日常运维所关注的网络性能和测试指标是否相关,相关性如何。

网络满意度表现值与其他指标均为定距变量,适用于Pearson的相关分析[2]。

2.2.2 单因素方差分析

关于区域类型与品牌类型的满意度单因素方差分析,是以A类对象网络满意度打分为分析数据,从区域和品牌两个控制因素进行方差分析,可使用单变量两因素方差分析来进行研究。在热点区域挖掘工作中,选取了不同区域类型热点,针对不同品牌同样数目用户的调查分析,根据类别进行方差分析,来找出区域与品牌不同的用户满意度影响差异[3]。

2.2.3 各细项及领先度偏相关分析

关于网络满意度与地区领先度、细项调研的相关性分析,是以B类对象总体调研打分为分析数据,对比调研不同细项以及与竞争对手差距的领先度。各细项指标按照一年4期11个地市成绩可以归类为44个数据样本,进行总体细项与地区竞争对手领先度的相关性统计分析,找出这些因素与网络满意度是否正相关。

2.2.4 网络满意度回归参数估计

多元回归分析建模,是以B类对象总体调研打分为分析数据,将与网络满意度正相关的不同用户感知细项进行多元回归分析,通过曲线估计和参数估计,确定最终满意度参数模型[4]。

3 分析建模过程及结论

3.1 网络满意度与网络性能、测试指标的相关性分析

由于存在随机抽样和样本数量较少等原因,通常样本相关系数不能直接用来说明样本来源的总体是否具有显著的线性相关性,而需要通过假设检验的方式对样本来自的总体是否存在显著的线性相关关系进行统计推断。基本步骤就是通过假设,选择检验相关系数,计算误差概率,最终通过相关系数临界决策非线性关系假设是否成立。由于是定距变量的关系,选择Pearson的相关分析,相关统计指标见式(1)、式(2)。

Pearson简单相关系数为:

Pearson简单相关系数的检验统计量为:

查相关系数临界表,置信度为a=0.01时,N= 36(专项36个热点区域),则t=0.418(相关系数临界可得)。如统计结果相关系数ρ大于t,则呈现显著相关,越接近1越接近线性相关,反之则接受原假设,无显著相关[2]。

3.1.1 热点区域网络满意度与网络指标的相关分析

将性能指标与测试指标汇总得出区域网络汇总指标,网络汇总指标是按照语音70%与数据30%加权形成。

绘制满意度表现与网络汇总指标的散点图如图3所示,散点图可以直观看出两者大致的相关程度,两数据分布较分散,相关性不强。

图3 网络满意度与网络指标散点Fig.3 Relationship scatter-dot of customer satisfaction and network KPI

通过Pearson分析输出结果可知,网络满意度与质量综合指标的显著性p=0.735>α=0.01,接受原假设,两指标零相关。上述两个变量的Pearson相关性ρ=-0.052<t=0.418,也同样证实,不呈现线性相关关系。将总体网络指标进行分解分析,对重要指标进行针对性剖析。

3.1.2 热点区域网络满意度与网络其他指标的Pearson分析

总体网络指标与网络满意度无明显相关性,将性能的语音与数据分别对比,以找出与网络满意度的相关关系。

首先,依然通过Pearson分析的方法进行网络满意度对后台语音指标对比,显著性p=0.647,两个变量的Pearson相关性ρ=-0.071。其次,再通过同样的方法进行网络满意度对后台数据指标对比,显著性p=0.77,两个变量的Pearson相关性ρ=-0.045。

如上数据得知,四对指标相关的显著性p>α= 0.01,接受原假设,两指标零相关。Pearson四对指标的相关性ρ<t=0.418,也同样证实,不呈现线性相关关系。

综上,在置信度为0.01时,优化类的网络指标与区域的满意度打分不存在严格的对应关系,说明区域网络指标跟踪与按照热点现场挖掘对于提升区域用户网络满意度贡献较小,从不满意用户回访跟踪能发现,区域不满意用户对网络的认知是非区域化的,影响满意度的因素更趋向于用户化。

在不满意用户深访的过程中发现其反应的问题范围覆盖较广,甚至跨省,说明用户在手机终端的使用过程中任何短板感知都能决定他们对整体网络的打分趋势。故影响用户满意度重要因素应该从用户本身下手,区域的网络优化是基础性工作,其网络的指标无法与用户满意度直接相关对应。

结合上述语音和数据后台指标,语音和数据测试指标四项分析,发现局部的重点优化对于整体网络满意度无显著相关,按点优化仅针对投诉用户。用户对网络的满意度感知需建立面优化与用户感知关联的概念,通过方差分析等来找出真正的差异化短板。继续对A类对象收集数据找出类型因素对总体满意度的影响差异,适用于单因素方差分析方法。

3.2 区域类型与品牌类型的满意度单因素方差分析

对于网络满意度打分,从区域和品牌两个控制因素进行方差分析,可使用单变量两因素方差分析来进行研究。在热点区域挖掘工作中,选取了不同区域类型热点,针对不同品牌同样数目用户的调查分析,根据类别进行方差分析,来找出区域与品牌不同的用户满意度影响差异。

样本数据取A类对象自专项36个热点区域的网络满意度表现值,进行方差分析首先要将类型进行可操作化定义。设定区域类型定义如表4所示,转换成待分析数据如表5所示。

表4 区域与品牌类型定义Table 4 Definition of areas and brand types

表5 按照定义表转换后的待分析数据表Table 5 Data table converted from table4

对转置后的数据进行方差齐性判定,对于不同因素的各组样本,如果属于方差齐性,就可以进行一般的单变量方差差异分析,从而确定不同区域和品牌对网络满意度影响大小。通过网络满意度作为因变量,区域和品牌作为自变量的齐性检验分析得出显著性p=0.993,说明组中变量方差齐性。

表6是主体间效应的检验结果,从总体校正模型、区域类型与品牌类型检验的显著性水平可以看出,检验概率值Sig.<0.05,拒绝变量与因素无关的假设,说明不同的类型因素对总体满意度打分存在显著影响。

表6 方差分析主体间效应的检验结果Table 6 Test results of ANOVA main effect

表7分别对区域类型水平差异的检验,可见车站码头与城郊结合部的分值偏高,而居民区、校园区与商务写字楼是需要集中加大网络覆盖与手机上网提升力度的区域,是区域中我们需要集中优化的重点。

表7 对区域类型水平差异的检验表Table 7 Test results of differences in the level of area types

从表8的品牌类型水平差异检验结果来看,全球通与动感地带不如神州行总体满意度高。

表8 对品牌类型水平差异的检验Table 8 Test results of differences in the level of brand types

3.3 网络满意度与地区领先度、细项调研的相关性分析

对B类对象,按照区域进行打分排列如表2所示。对表2指标进行相关与偏相关分析,找出领先度控制变量对各满意度细项不同的影响。

3.3.1 网络满意度与领先度的Pearson分析

经验判断网络对于竞争对手领先度与网络满意度为线性相关,而其他商业过程亦是如此。该结果需要使用Pearson相关分析检验来进一步印证。分析过程同上述满意度与3.1.1相同。

分析得出,网络满意度与领先度相关的显著性p=0.000 3<α=0.01,拒绝零相关的原假设,两指标显著相关。两个变量的相关性ρ=0.672>t(n-2)=t(42)=0.393,也同样证实,呈现显著线性相关关系。领先度对满意度的直接关系,从经验中我们已经得到这样的认知,用户使用3G网络的网速与覆盖能力相对较强,总体感知会比较偏高。对用户不同类型(覆盖、网速、质量)满意度同样的分析,都能得出领先度与打分显著关系的结论。

3.3.2 加入领先度控制变量的网络满意度与网络细项满意度的偏相关分析

简单相关系数研究两变量间线性相关性,若还存在其他因素影响,其往往夸大变量间的相关性,不是两变量间线性相关强弱的真实体现。围绕各商业过程的领先度偏相关分析,找出领先度最敏感的商业过程,对此商业过程领先度的关注,可以增强商业过程提升的针对性。

偏相关分析也称净相关分析,它在控制其他变量线性影响的条件下分析两变量间的线性关系,所采用的工具是偏相关系数。控制变量个数为1时,偏相关系数称一阶偏相关;当控制两个变量时,偏相关系数称为二阶偏相关;当控制变量的个数为0时,偏相关系数称为零阶偏相关,也就是简单相关系数。将领先度设置为控制变量,那么我们将要进行研究的即是一阶偏相关。

假设有3个变量y、x1和x2,在分析x1和y之间的净相关时,需控制x2的线性作用,则x1和y之间的一阶偏相关定义为:

式中,ry1、ry2和r12分别表示y与x1,y与x2、x1与x2的相关系数。

对样本来自的两总体是否存在显著的净相关进行推断,检验统计量为:

对于本次偏相关试验统计的样本来说,应该取t(44-1-2)=t(41)=0.393。

我们对室内通话质量,通话畅通和手机上网(因为通话畅通与清晰度,手机上网稳定性与速度分值非常接近,故将其合并)。三类数据进行加入领先度控制量的前后相关性对比,得出领先度对某个商业过程存在正影响的结论。

分析得出,显著性ρ=0.000 8<α=0.01,拒绝零相关的原假设,室内质量与网络满意度总体表现的相关性较强,前后均呈现显著线性相关。相关性ρ1=0.744>ρ2=0.653,加入领先度控制因素后,发现ρ2=0.653,显著性下降。室内质量对网络总体满意度影响较大,领先度在室内质量提升中,没有更积极的因素。即对于室内通话质量,无须与竞争对手进行对比,提升自身网络覆盖,保证用户正常使用是最重要的感知提升手段。

通话畅通结论与上述室内通话质量一致。显著性ρ=0.000 6<α=0.01,拒绝零相关的原假设,室内质量与网络满意度总体表现的相关性较强,前后均呈现显著线性相关。相关性ρ1=0.738>ρ2=0.635,加入领先度控制因素后,发现ρ2=0.635,显著性下降。领先度对通话畅通更积极的影响有限。

对于手机上网对于网络满意度的影响,我们分析得出与上述两个不同的结论。网络满意度与手机上网的偏相关显著性p=0.000 8<α=0.01,拒绝零相关的原假设,手机上网与网络满意度总体表现的相关性较强,前后均呈现显著线性相关。相关性ρ1=0.730<ρ2=0.752,加入领先度控制因素后,发现ρ2=0.752,显著性提升。证明领先度在手机上网提升中,有更积极的因素。

对于手机上网,需要关注用户状况,用户对数据业务感知对比不同网络的意愿略强。在三家运营商网络均差的区域,提升移动网络覆盖的同时,加大数据信道的配置,对满意度贡献会更大。

3.4 网络满意度与网络细项满意度的回归建模

由于得出了对网络满意度的一些显著相关的因素,即各区域的网络领先度与其网络细项满意度均与最终的区域网络满意度打分显著相关,但需进一步分析各个因素对总体打分的贡献值是多少。我们将通过回归分析方法来建立细化到用户打分的相关性模型。

样本取自B类对象,数据如2.1中表3所示。通过对总体网络满意度(Y)、网络覆盖(X1)、网络质量(X2)、信息接收(X3)与手机上网(X4)5项进行回归分析,找到对总体网络满意度(Y)与其他子项的相关性模型,找出对总体打分影响最大的因素。

多元非线性回归分析,首先对4个因变量进行与网络满意度(Y)的曲线估计,找出回归可能函数属性。经过两两回归估计,得知4对的模型最接近线性相关。其中表9是网络满意度与网络覆盖的线性估计参数,调整后的R方相对于其它各曲线估计最大,自变量为网络覆盖。

表9 网络满意度与网络覆盖的线性估计参数Table 9 Linear estimation parameters of customer satisfaction and network coverage

表10 网络满意度与相关因素之间的线性回归分析结果Table 10 Linear regression results of customer satisfaction and related factors

从分析结果可以看出,由于显著性水平小于0. 05,拒绝不相关的假设检验,各自变量的与因变量的线性相关。同时,根据得出的系数可得出最终线性回归表达式为式(6):

信息接受发送质量对网络整体满意度的影响非常小,可忽略。对网络满意度打分影响最大的首先是网络覆盖,对整体影响大致3成左右,其次是手机上网,对整体影响占到1/4。

4 网络满意度统计分析及建模的意义

本文通过数理统计方法,建立网络满意度提升模型,并找出对指标提升重点方向。

首先,根据式(6)的建模结果,我们阶段性的工作重心应该全面向网络覆盖和手机上网专项转移,落实工程建设与网络优化的联动策略,并结合4G网络的开展,实现手机上网网速需求更高的区域网络的优先建设与分流工作。

第二,从区域因素分析,我们也找到了差异化区域问题,热点区域的集中优化成为了专项的落脚点。经过对本地热点专项调研数据分析,校园、居民区与商务写字楼是网络优化资源重点提升的区域,并且针对已有的短板集中提升后,完成调研评估后进行方差分析,可以为自上而下的年度KPI考核提供参考依据。

第三,神州行用户的满意度相对较高,同时也是调研用户中权重和市场占比最大的用户分类。从各项结论中都证明神州行品牌用户维护的重要性,而品牌提升不仅仅是网络,更需要从资费、套餐、营销设计中更多的融合方案的出台,尤其是在4G网络初期,对大众融合套餐的合理设计,流量经营的有效引导对网络满意度也有更大的提升作用。第四,在明确领先度对网络满意度最重要的影响后,利用偏相关分析方法进行各商业过程剖析,发现只有手机上网细项中,领先度有着明显的辅助提升作用。即说明,如果手机上网的领先度相对下降,那么网络满意度总体指标将会恶化。在关注区域领先度中,室内通话质量与日常语音方面仍然需按照日常手段提升,对于3/4G移动互联网业务,更要对比区域内的竞争对手数据网络情况,确保自身网络覆盖和数据业务速率更优于其他运营商。

5 结 语

上述内容进一步印证热点区域化指标与满意度的不显著相关结论。按照单变量方差分析,找到不同区域各自短板,明确大众品牌相对满意度会更高的结论。回归分析建立以覆盖和移动互联网为主的网络满意度模型,给出满意度各项工作的全面开展方向。

使用数理统计对于集合满意度相关不同类型和各商业过程的数据有着较强的回归能力。通过模型建立和类别差异的有效分析,对市场营销、网络建设和维护优化等工作会形成基于用户满意度为核心的工作思路。

[1] 余勇昌,徐霖霖,陈广湖,等.移动终端质量评估模型构建与应用探讨[J].通信技术,2012,45(11):67-73.

YU Chang-yong,XU Lin-lin,CHEN Guang-hu,etc. Construction and Application of Mobile Terminal Quality Evaluation Model[J].Communications Technology, 2012,11:67-73.

[2] 陈炳为,许碧云.等级资料的多项相关、直线相关及秩相关系数的比较[J].现代预防医学,2009(17):7-9.

CHEN Bing-wei,XU Bi-yun.Comparison of Coefficients among Poly Choric Correlation,Pearson Correlation and Rank Correlation of Rank Data[J].Modern Preventive Medicine,2009,17:7-9.

[3] 叶红卫,朱蓝辉.应用SPSS进行双因子方差分析[J].河北北方学院学报:自然科学版,2008,04(02):63-65.

YE Hong-wei,ZHU Lan-hui.Using SPSS to Make Double Factor Variance Analysis[J].Journal of Hebei North University(Natural Science Edition),2008,04(02):63-65.

[4] 张宇山.多元线性回归分析的实例研究[J].科技信息,2009(09):54-56.

ZHANG Yu-shan.A Case Study of Multiple Linear Regression Analysis[J].Science and Technology Information,2009,09:54-56.

WANG Kai(1983-),male,M.Sci.,engineer,majoring in correlation analysis of customer satisfaction and wireless network optimization.

谢岳通(1978—),男,硕士,工程师,主要研究方向为2/ 3/4G无线多网协同提升分析。

XIE Yue-tong(1978-),male,M.Sci.,engineer,majoring in multi-network collaboration analysis of 2/3/4G wireless network.

Analysis on Mathematical Statistic Modeling of Wireless Network Satisfaction

WANG Kai,XIE Yue-tong
(Ningbo Branch,China Mobile Communications Corporation,Ningbo Zhejiang,315040,China)

Customer satisfaction of mobile network,as the core of job requirements in network operation and maintenance,now becomes increasingly prominent.Whether the improvement of network KPI has apparent impacts on customer satisfaction,and what dimensions and measures should be implemented to seek the working direction of network satisfaction,these two are critical subjects for telecom carriers.In order to find the core of network satisfaction focused on customers,this paper discusses the correlation regularity of relevant factors concerning network satisfaction via some mathematical statistics methods such as regression analysis and ANOVA with SPSS platform,so as to draw conclusion on model and direction of network satisfaction optimization.

mathematical statistic;regression analysis;correlation;partial correlation;ANOVA;network satisfaction

TP309

A

1002-0802(2014)10-1191-07

10.3969/j.issn.1002-0802.2014.10.017

王 凯(1983—),男,硕士,工程师,主要研究方向为客户服务满意度与网络优化指标相关性分析;

2014-05-15;

2014-07-14 Received date:2014-05-15;Revised date:2014-07-14

猜你喜欢

领先显著性变量
抓住不变量解题
本刊对论文中有关统计学表达的要求
我国铁钌接力催化氨合成技术国际领先
也谈分离变量
基于显著性权重融合的图像拼接算法
潍柴:从领先到引领
一种基于词袋模型的新的显著性目标检测方法
图像序列的显著性目标区域检测方法
分离变量法:常见的通性通法
变中抓“不变量”等7则