
技术摘要:
本发明公开了一种基于主成分分析的卷烟市场饱和度评价方法及系统,属于卷烟市场饱和度评价领域,本发明要解决的技术问题为如何利用主成分分析能够量化卷烟市场饱和度,确保根据卷烟市场饱和度进行卷烟的精准投放,采用的技术方案为:该方法是根据获取的卷烟的指标数据 全部
背景技术:
传统的卷烟市场饱和度评价,往往是根据有经验的业务人员的专家经验,得到某 个规格卷烟的订货销售指标以及信息采集指标,根据这些指标数据来大体估计市场饱和度 的情况,这样得到的市场饱和度主观性太强,缺乏客观计算数据的支撑,不能够量化市场饱 和度这一综合指标,不具有较强的说服力,根据某规格卷烟市场饱和度来进行卷烟投放时 不能够做到精准投放。 主成分分析首先是由K.皮尔森(Karl Pearson)对非随机变量引入的,尔后H.霍特 林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。在用统 计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。我们希望变量个 数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间 有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析 是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的 新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能 保持原有的信息。设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根 据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方 法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。 故如何利用主成分分析能够量化卷烟市场饱和度,确保根据卷烟市场饱和度进行 卷烟的精准投放,消除传统卷烟市场运行状态评价缺乏科学性、及时性、难以持续优化的缺 点是目前亟待解决的技术问题。 专利号为CN103324147A的专利文献公开了一种基于主成分分析的卷烟工序质量 评价方法及其系统,采用主成分分析法对多变量工序的加工质量进行评价,为全面把握工 序质量加工状况和工序质量改进提供依据。首先计算工序各工艺参数的过程能力指数,并 采用主成分分析法对各工艺参数数据进行分析,按照累计方差贡献率大于等于90%的原则 确定主成分个数,并根据各主成分解释方差的大小确定其权重,最后采用算术加权法得出 工序综合过程能力指数。但是该技术方案不能量化卷烟市场饱和度,无法根据卷烟市场饱 和度进行卷烟的精准投放。
技术实现要素:
本发明的技术任务是提供一种基于主成分分析的卷烟市场饱和度评价方法及系 统,来解决如何利用主成分分析能够量化卷烟市场饱和度,确保根据卷烟市场饱和度进行 卷烟的精准投放,消除传统卷烟市场运行状态评价缺乏科学性、及时性、难以持续优化的缺 点的问题。 5 CN 111582931 A 说 明 书 2/8 页 本发明的技术任务是按以下方式实现的,一种基于主成分分析的卷烟市场饱和度 评价方法,该方法是根据获取的卷烟的指标数据,通过主成分分析方法确定各指标的权重, 并计算卷烟市场饱和度,根据量化后的市场饱和度分析各卷烟的市场状态预测卷烟的市场 趋势,辅助营销决策,合理规划各个销区各个卷烟的投放量,做到精准投放,使各卷烟维持 在平衡稍紧的状态;具体如下: S1、获取并预处理数据; S2、确定指标权重:通过spss软件进行因子分析确定指标权重; S3、计算市场饱和度:将标准化后各指标的值与指标权重相乘加和求得市场饱和 度的大小; S4、判断并确定营销决策:用聚类分析方法依据各指标对样本集进行聚类分析,判 断聚类结果与市场饱和度分布是否一致,进而合理规划卷烟、销区数量。 作为优选,所述步骤S1中获取并处理数据具体如下: S101、选择并获取数据:包括卷烟的订货销售指标以及信息采集指标; S102、数据预处理:分别横向、纵向的查看每个指标进行对比分析,将每个指标的 数据按多个区间划分,统计各区间内数据的个数,并剔除掉极值、异常值,同时找出缺失值 并进行替代处理; S103、特征工程:包括特征选择、特征提取和特征构建。 更优地,所述步骤S101中卷烟的订货销售指标包括订单满足率、投需比、订足面、 订购面、重需面和订足率; 其中,订单满足率=客户订购量/客户需求量*100%; 投需比=客户投放量/客户需求量*100%; 订足面=订足户数/订购户数*100%; 订购面=订购户数/总户数*100%; 重需面=某规格本期有需求记录的零售客户数/前三周期有该规格订单记录的零 售客户数*100%; 订足率=订购量/投放量*100%。 更优地,所述信息采集指标包括市场覆盖率、社会销量和社会库存; 其中,市场覆盖率是指卷烟市场覆盖情况; 社会销量是指所有客户周期销售; 社会库存是指所有客户期末库存。 更优地,所述步骤S102中数据预处理包括数据格式化、数据清理或数据采样; 其中,数据格式化是将一组数据按照规格式样进行规范,并记性表示、存储、运算; 在求饱和度时涉及到卷烟的订货销售指标以及信息采集指标,将采集到的卷烟的订货销售 指标以及信息采集指标用浮点数表示,并用DataFrame表格存储,行索引为卷烟品规,列索 引为卷烟的订货销售指标以及信息采集指标,利用dataframe切片方法读取数据并计算; 数据清理是指删除异常值和极值并将缺失数据用该缺失数据所对应指标求平均 值来代替; 数据采用是指通过随机抽样或分层抽样构建所需要的样本集,在计算卷烟的订货 销售指标以及信息采集指标时,随机抽取部分零售户并采集零售户订购信息进而计算指标 6 CN 111582931 A 说 明 书 3/8 页 或者根据零售户档位,每档选出指定比例的零售户并采集零售户的订购信息进而计算指 标。 更优地,所述步骤S103中特征选择是指从从特征集合中挑选一组最具统计意义的 特征子集,从而达到降维的效果;其中,特征集合指的是数据预处理完成之后的dataframe 多维表格中每一列所构成的集合; 所述步骤S103中特征提取是指根据数据预处理完成后的dataframe表格中的原始 数据自动构建新的特征,将原始数据的特征转换为一组具有明显物理意义(Gabor、几何特 征[角点、不变量]、纹理[LBP HOG])或统计意义或核的特征; 所述步骤S103中特征构建是指从数据预处理完成后的dataframe表格中的原始数 据,再结合根据卷烟业务知识,挖掘潜在形式和数据结构,构建新的特征。 更优地,所述步骤S2中确定指标权重具体是利用spss软件中的因子分析得到降维 后的主成分,根据主成分载荷以及特征值计算主成分线性组合的系数,再根据方差贡献率 计算各指标的权重; 其中, 主成分载荷数是指成分矩阵中各成分数值;特征值是指总方差解释中上午总计 值; 指标i权重=(指标i各成分系数*各成分方差贡献率)/(各成分方差贡献率之和); 各成分方差贡献率即为提取载荷平方和的方差百分比。 更优地,所述步骤S3中饱和度的公式为: 市场饱和度M=λAA λBB λCC λDD λEE λFF λGG; 其中,A、B、C、D、E、F、G为各指标值,λA、λB、λC、λD、λE、λF、λG为各指标的权重。 更优地,所述步骤S4中用聚类分析方法依据各指标对样本集进行聚类分析,判断 聚类结果与市场饱和度分布是否一致,进而合理规划卷烟、销区数量具体如下: S401、提取数据预处理完成后的dataframe表格中的原始数据作为样本集; S402、提取步骤S401中dataframe表格中每一行数据作为一种卷烟样本,将卷烟样 本中的各指标的数据用向量表示,通过层次聚类算法对采用向量表示的卷烟样本进行聚 类; S403、计算出每个卷烟样本的市场饱和度,根据市场饱和度的结果将卷烟可分为3 类:A饱和度大,B饱和度小,C饱和度中等; S404、通过层次聚类算法将所有卷烟分成3类:D饱和度大、E饱和度小、F饱和度中 等,分别对比A与D、B与E、C与F的差异性; S405、判断有差异的样本数量与该类别中所有样本数量百分比是否小于10%: 若是,则判断计算结果准确,确定营销决策。 一种基于主成分分析的卷烟市场饱和度评价系统,该系统包括, 数据获取及预处理模块,用于选择并获取卷烟的订货销售指标以及信息采集指标 的数据并完成数据格式化、数据清理或数据采样的数据预处理,再进行特征选择、特征提取 和特征构建; 7 CN 111582931 A 说 明 书 4/8 页 指标权重确定模块,用于利用spss软件中的因子分析得到降维后的主成分,根据 主成分载荷以及特征值计算主成分线性组合的系数,再根据方差贡献率计算各指标的权 重; 市场饱和度计算模块,用于将标准化后各指标的值与指标权重相乘加和求得市场 饱和度的大小; 营销决策判断并确定模块,用于利用聚类分析方法依据各指标对样本集进行聚类 分析,判断聚类结果与市场饱和度分布是否一致,进而合理规划卷烟、销区数量。 本发明的基于主成分分析的卷烟市场饱和度评价方法及系统具有以下优点: (一)本发明基于主成分分析,对输入指标进行相关性分析并降维处理得到主成 分,根据每个主成分的方差贡献率确定每个主成分的权重大小,然后用因子载荷确定各指 标权重,因子载荷的大小可以反映出共性因子对观测指标的影响程度,也可以用因子载荷 的大小来确定每一个指标与主成分的相关程度大小,因子载荷越大表明该指标与该主成分 的相关程度越高,该指标在该成分中占的权重也将越大; (二)本发明为解决传统卷烟市场运行状态评价方法缺乏科学性、及时性、难以持 续优化等问题,利用大数据技术及主成分分析方法计算市场饱和度,根据卷烟的订货销售 指标以及信息采集指标,通过主成分分析方法确定各指标的权重,并由此计算卷烟市场饱 和度,根据量化后的市场饱和度分析各卷烟的市场状态预测卷烟的市场趋势,辅助营销决 策,合理规划各个销区各个卷烟的投放量,做到精准投放,使各卷烟维持在平衡稍紧的状 态; (三)本发明基于主成分分析确定指标权重,订货销售指标以及信息采集指标之间 存在较强的关联性,在众多指标中筛选出核心特征值用于确定指标权重是研究的关键,选 用主成分分析法实现特征值得选取,在降维的同时还可以去除噪声,发现数据中的关联模 式; (四)本发明采用聚类分析验证市场饱和度求取结果,将极差标准化后的指标进行 聚类分析,看聚类结果与市场饱和度分布是否一致,如果有较大差距,可重新对原始数据进 行筛选清理,并选择合适的标准化方法,通过不断地改进,确保求得的市场饱和度具有较高 的准确度,能够很好地描述卷烟市场情况,为卷烟营销决策提供数据支持; (五)本发明通过指标权重量化后的市场饱和度代替人为经验主观判断,相较于人 为产生的专家经验对市场饱和度进行主观判断,通过对多指标进行主成分分析来量化市场 饱和度,实现了对卷烟市场饱和度的量化分析,相较于根据专家人为经验确定市场饱和度 的方法更具科学性和说服力,减少了主观因素较大所带来的误差,货源分配更加合理均衡, 更具科学性、及时性、可以持续优化,预测卷烟的市场趋势,辅助营销决策,合理规划各个销 区各个卷烟的投放量。 附图说明 下面结合附图对本发明进一步说明。 附图1为基于主成分分析的卷烟市场饱和度评价方法的示意图 8 CN 111582931 A 说 明 书 5/8 页