APP下载

基于logistic回归的定制卷烟接受度研究

2018-01-16张茜

科技视界 2018年28期
关键词:卷烟维度问卷

张茜

【摘 要】logistic回归分析是一种研究二分类或多分类问题的有效方法,适用于卷烟定制接受度分析及预测。通过调查问卷数据构建企业信息维度与接受度的logistic回归方程并检验模型系数,可以用于分析预测不同类型企业对定制卷烟的接受度,为精准市场推广提供数据参考。

【关键字】logistic回归;定制卷烟;商务市场

中图分类号: TS411 文献标识码: A 文章编号: 2095-2457(2018)28-0272-002

DOI:10.19694/j.cnki.issn2095-2457.2018.28.127

【Abstract】Logistic regression analysis is an effective method to study the problem of binary classification or multiple classification,which is applicable to the analysis and prediction of cigarette customization acceptability.The logistic regression equation of enterprise information dimension and acceptability was constructed based on the questionnaire data and the model coefficient was tested,which could be used to analyze and predict the acceptability of customized cigarettes of different types of enterprises and provide data reference for accurate market promotion.

【Key words】Logistic regression;Customized cigarettes;The business market

為了满足消费者私人定制需求,全省创客工作室推出了卷烟定制服务并在前期进行广泛的市场调研,目的是挖掘消费者需求,改进定制产品。

问卷数据由消费者信息和消费者意愿两个维度组成,两者之间会存在一定的联系,不同类型的消费者对卷烟定制的接受会有所不同。如果从问卷数据中挖掘出不同类型的消费者对卷烟定制的接受度,创客工作室就能对接受度高的消费者进行精准宣传。

1 模型的建立

商务市场的消费者是企业商家,企业的信息维度包括行业类别、地区等企业的基本信息,企业的意愿是对定制卷烟的接受度。分析各维度数据之间的相关关系有多种算法,关联分析、决策树分析等算法都可实现,但是关联分析算法和决策树算法建立的是关系模型并非数值模型。

数值化研究两种或两种以上变量之间定量关系需要运用回归分析的方法。但是在构建企业信息与企业意愿的回归模型时会存在因变量是二分类变量而非数值变量的情况。企业意愿存在“高”或“低”两种情况,这是二分类问题。logistic回归就是研究二分类或多分类的问题的回归分析方法。

1.1 维度选取

设企业对定制卷烟的接受度为因变量Y,Y是一个二分类变量,“很感兴趣”、“可以考虑”为“接受度高”,取值为1;“说不好”、“不感兴趣”为“接受度低”,取值为0。影响因变量Y的自变量记为X,代表企业的信息维度,包括:企业所处地区x1、行业类别x2、员工规模x3、集团消费用烟是否有卷烟x4、有无定制先例x5、年卷烟采购量x6。

1.2 logistic回归模型

logistic回归模型发掘的是不同类型企业接受卷烟定制(Y为1)的条件概率:

P=P(Y=1|x1,x2,…,x6)

logistic回归模型在用于研究变量之间数值关系时具有明显优势。首先它对自变量没有明确要求,可以是连续变量,也可以是离散变量或是虚拟变量,而且不需要正态性假设。当被解释变量是二分类变量时,logistic回归是研究解释变量与被解释变量的常用方法。消费者对定制卷烟接受度是一个二分类变量,logistic回归可以很好解决这类问题。

3 数据预处理

3.1 数据清洗

用于建立模型的数据来源于调查问卷,但是由于填写问卷人员的知识水平、细心程度的不同,调查中收集的调查问卷并不能全部用来分析,需要对异常的问卷进行清洗,对缺失值进行补充。无效问卷主要为选项矛盾问卷、重复性问卷、不符合逻辑关系问卷。通过建立逻辑判断规则对整体的问卷数据进行清洗、筛选。

3.2 数据转换

离散变量通常是用虚拟变量进行处理,而问卷数据大多数都是离散变量。如果虚拟变量进行处理,则6个维度自变量数据可以表示为阿拉伯数字,比如员工规模x3可以分类为“50人及以下”、“50-500人”、“500人以上”,分别用0,1,2表示。但是虚拟变量并不能代表原始数据的含义,众多虚拟变量的使用会造成分析结果不易解读并降低准确率。

从模型中可以看出,在所有自变量中,企业的员工规模、是否有无定制先例和地区分布对预测企业对定制卷烟接受度时有重要影响。结合woe值分析,经济发达地区、中等规模(50-500人)、有定制先例的企业对个性化定制卷烟的接受度更高。其它指标影响虽不是关键因素,但也存在影响,结合woe值分析,零售餐饮业、集团消费用品有卷烟、年卷烟采购量中等(50-200条)的企业对定制卷烟接受概率更高。

通过logistic回归模型,可以估计预测某企业对定制卷烟接受的程度,根据概率的高低决定是否值得宣传,精准定位企业的同时提高了推广效率,应用性很强。假设衢州地区有一家300人的制造业企业,集团消费用品有卷烟但无定制先例,年卷烟采购量在100天左右。创客工作室通过logistic回归模型可以推算出此企业接受卷烟定制的概率为84%(大于50%),判断此企业值得宣传推荐,可以重点关注。

5 总结与展望

目前,卷烟定制服务还处在起步阶段,市场行为研究不充分,市场宣传推广具有盲目性。通过logistic回归方法构建的模型不仅充分挖掘了调查问卷数据,定量分析市场环境的同时还可以推算预测未知的市场,为市场推广提供依据。通过市场的完善、样本数据的积累,logistic回归模型可以进行拓展,提高精确度,更好得分析预测市场。

【参考文献】

[1]Keating K A,Cherry S.Use and Interpretation of Logistic Regression in Habitat-Selection Studies[J].Journal of Wildlife Management,2011,68(4):774-789.

[2]Gude J A,Mitchell M S, Ausband D E, et al. Internal Validation of Predictive Logistic Regression Models for Decision-Making in Wildlife Management[J]. Wildlife Biology, 2017, 15(4):352-369.

[3]姜广辉,张凤荣,陈军伟,等.基于Logistic回归模型的北京山区农村居民点变化的驱动力分析[J].农业工程学报, 2007,23(5):81-87.

猜你喜欢

卷烟维度问卷
问卷网
光的维度
“五个维度”解有机化学推断题
卷烟包装痕迹分析
人生三维度
我国卷烟需求预测研究述评
卷烟引燃倾向测试方法的研究与改进
卷烟加料中1,2-丙二醇的快速测定方法