APP下载

基于大数据分析的极致用户画像及应用研究

2019-10-29韦广林中国联通网络技术研究院北京100048

邮电设计技术 2019年10期
关键词:计费冰激凌套餐

王 雨,王 题,韦广林(中国联通网络技术研究院,北京 100048)

1 概述

2017 年底,中国联通的不限量套餐用户已经超过5 000万,贡献全网超过一半的流量。中国联通的定向应用免流量套餐和不限量套餐中规定用户当月使用流量超过40 GB时将自动关闭上网功能或者进行限速控制,但在目前市场和政策下,未严格实施该政策,导致仍有一部分单月流量超过40 GB 的极致用户,对网络影响较大。为了了解极致用户的属性和流量使用特征,从而完善网络侧和市场侧的应对策略,为可能出现的因极致用户数量增长带来的网络侧冲击提前做好准备,本文以部分省份的极致用户群体为目标,基于用户侧计费账单、计费详单及网络基础工参数据,分析极致用户的画像和通信行为,并根据用户的不同特征将用户进行分类,针对性地提出应对策略和建议。

2 极致用户分析

2.1 分析数据源

选取部分省份2018 年3 月的计费账单数据、计费详单数据以及基础工参数据进行深入分析。

2.1.1 用户侧账单数据

用户侧计费账单数据是用户的消费数据,包括了用户的基本信息、订购业务信息、通信时间信息、通信费用信息等,具体包含用户ID、客户年龄、用户性别、业务类型、是否上网卡顿、证件类型、是否集客用户,集客公司名称等基本属性,同时包含用户当月的语音通话时长、数据业务流量以及实际消费情况。通过对用户计费账单数据的分析,电信运营商可以了解用户的基本属性。

2.1.2 用户侧详单数据

用户侧计费详单数据分为语音详单及数据详单,包含用户当月的每一次语音通话及数据上网业务记录。其中语音详单主要记录用户的语音通话信息,包含用户ID、时间、通话时长、LAC、CI 等信息;数据详单主要记录用户的上网信息,包含用户ID、时间、上行流量、下行流量、LAC、CI 等信息。本研究主要分析极致用户的数据详单,通过分析用户的数据行为,可以发现用户发生流量的区域等信息,从而了解用户画像。

2.1.3 基础工参数据

本文中用到的基础工参数据包含网络中各个小区的基础信息及小区所处的地理场景等信息,包含LAC、CI、经度、纬度、覆盖类型、宫格名称、宫格类型、网格名称、网格场景等信息。网格指网络规划中根据所在区域的场景类型将地理区域划分成的多个区域,宫格是根据细分的场景将网格划分成的更小的地理区域,小区与宫格存在一定的对应关系,可以由此得到小区的所在地理场景。通过综合分析用户详单和基础工参数据,可以知道用户业务的地理分布和用户的常住地。

2.2 数据准备

为了清楚地了解极致用户的特征,筛选出月DOU大于40 GB 的用户,作为极致用户群体。同时提取出如下数据,进行关联分析。

a)从用户账单中提取出用户ID、ARPU、DOU、MOU、年龄、职业、套餐等信息。

b)从数据详单中汇总得到每个用户在所经过的任何一个小区中产生的数据流量,同时汇总得到所有用户一天24 h内的流量分布,找到忙时和闲时时段。

c)从语音详单中汇总得到每个用户在所经过的任何一个小区中产生的语音业务量。

d)将步骤b)和步骤c)得到的结果按照用户汇总,与基础工参数据关联匹配,得到每个用户的常住地宫格和宫格所对应的场景。

根据以上步骤得到的数据,对极致用户进行属性和业务分析。

2.3 极致用户总体业务贡献

图1所示为极致用户数量和所用数据流量的发展趋势,极致用户人数和流量均不断提升,2018 年3 月4G 用户中的极致用户占比由1.5%提升为3.8%,同时流量贡献由19%增长为30%,用户对流量的需求不断提升,对网络的压力也不断增大(见图1)。

图1 极致用户发展趋势

3 极致用户画像

3.1 极致用户年龄分析

将极致用户的年龄按照区间划分,由图2 可知极致用户主要分布在16~30 岁之间,这个年轻群体业余时间相对充足且对新鲜事物敏感,占比高达79%。

图2 极致用户年龄分布

3.2 极致用户职业分析

将极致用户的职业分为13 个大类(见图3),由图3 可知极致用户的职业主要为农民、务工人员、企业职工以及高校学生,占比均达到15%以上。

3.3 极致用户套餐分析

极致用户的套餐包含了冰激凌、腾讯王卡、普通4G 套餐、各种互联网套餐等多种类型,其中腾讯王卡和冰激凌2类定向免流或者不限流量的用户占比达到81%,其他用户占比19%。

图3 极致用户职业分布

3.4 极致用户常住地分析

根据用户的业务详单,统计分析得到用户的工作常住地址,从而得到极致用户的常住地场景,如图4所示,可知极致用户中42%的用户常住地为市区,其次为行政村和县城。

市区内场景相对比较复杂,因此对常住地为市区的极致用户进一步分析,得到如图5 所示结果。市区内,极致用户比较集中的场景是各类住宅、企事业单位、工业及科技园区等场景。

图4 极致用户常住地分布

3.5 极致用户画像总结

由第3.1~3.4节可知,目前网络中的极致用户的基本特征可归纳如下。

a)30岁以下年轻人。

b)职业主要为农民、务工人员、企业职工以及高校学生。

c)使用套餐主要为冰激凌套餐和腾讯王卡套餐。

d)常住地主要是市区的各类住宅、企事业单位、工业及科技园区等场景,行政村分布也较多。

4 极致用户业务分析及应对策略建议

为了深入了解极致用户使用业务的情况及在收入方面对网络的贡献,区分出哪些用户随着流量的升高收入贡献逐步提升,哪些用户随着流量的升高收入贡献逐渐降低,并从网络和市场等多方面对这些不同的用户采取差异化的鼓励或限制措施,本小节对每个极致用户的收入与业务进行联合分析,同时结合用户业务的时间分布,将用户进行分类,并针对各类用户给出应对建议。

4.1 极致用户ARPU分析

极致用户的套餐类型主要为冰激凌和腾讯王卡2种,目前冰激凌用户的ARPU 主要为99、199 或者这2个档位的打折之后的价格,腾讯王卡用户的平均ARPU 在40~50 元。综合考虑这2 个套餐的用户,将极致用户的ARPU分成如图6所示的10个区间。

极致用户的ARPU 区间主要集中在199 元以下,占比高达94.6%,大于199 元的高ARPU 用户较少。(50,99]元区间用户数最多,其次为(99,199]区间。由于冰激凌用户的套餐费用最多为199 元,所以设定ARPU高于199元的极致用户为高ARPU用户。

4.2 极致用户综合单价分析

极致用户的平均综合单价为1.6 元/GB,91.2%的极致用户综合单价低于3元/GB,50%的极致用户单价集中在1~2元之间(见图7),这些用户流量的增长并未同时带来收入的增加。

图5 极致用户常住地分布——市区

图6 极致用户ARPU分布

图7 极致用户综合单价分布

综合考虑腾讯王卡和冰激凌用户综合单价,设定综合单价大于3元/GB的极致用户为高综合单价用户。

4.3 极致用户流量时间分布

统计所有4G用户全月24 h流量分布情况,发现凌晨1 点到早上7 点为流量使用的低谷,即网络闲时,其他时间流量均较高,设定为网络忙时。

分别统计每个极致用户在闲时发生的流量占个人总流量的比例,将用户分为闲时主导(闲时流量大于50%)和忙时主导(忙时流量大于50%)两大类。得到如下结果,98.6%的用户流量主要集中在忙时,仅1.4%的用户流量主要发生在闲时。

4.4 极致用户分类及应对策略建议

联合分析第4.1~4.3 节中的3 个因素,综合用户价值、网络负荷等因素,将用户分成以下4类(见表1)。

对于第1 类和第2 类高价值用户,建议暂时不实施限速策略,鼓励用户业务继续增长,同时获取更多的收益。

表1 极致用户分类

对于第3类低价值但业务主要发生在闲时时段的用户,可以暂时不实施限速或者在忙时适当限速。

对于第4 类低价值且业务主要发生在忙时用户,当用户流量超出40 GB阈值时,开启限速措施。

在限速时,也可以结合用户所在区域的业务量的地理和时间分布酌情制定限速措施,对于网络较闲区域的用户可以暂不限速,在闲时发生的业务也可暂不限速。同时,可以根据用户超出40 GB 阈值的多少,采取类似阶梯电价的方式分级限速。

5 总结及展望

本文基于通信运营商计费侧用户账单、详单数据以及工参数据,首先研究了月DOU 大于40 GB 的极致用户的画像,即30岁以下年轻人,职业主要为农民、务工人员、企业职工以及高校学生,套餐主要为冰激凌和腾讯王卡,常住地主要是市区的各类住宅、企事业单位、工业及科技园区等场景;然后分析了极致用户的业务特征,综合考虑用户价值和网络负荷等因素,将其归为四大类,并对每类用户提出了相应的限速策略或限速措施。各本地网可基于本文的方法对当地的极致用户进行分析归类,并针对性地采取应对措施,减少极致用户对网络的压力,提升本地网其他用户的感知。一方面可以根据极致用户使用的终端是否为路由器等因素鉴别出哪些是违规共享用户,向共享者和被共享者推荐主副卡业务,提升用户黏性的同时避免集中共享带来的局部流量冲击,另一方面对共享热点的免流行为,可以考虑和互联网公司联合研究共享流量识别办法,对相应的流量进行常规计费。

猜你喜欢

计费冰激凌套餐
5G网络独立组网中融合计费方案的研究
基于云计算和微服务架构的高速公路计费系统
哇!甜甜的冰激凌
《加什么不要钱》
生活中的分段计费
儿童套餐
冰激凌
夏日冰激凌大作战
基于AM3354的电动汽车充电监控计费系统电表通信的实现
婚姻是一份套餐