前文我们从技术方向讨论了“预测案例2”(预测案例2:有限客户/行业), 主要是所需要的“聚类分析”,讨论内容包括:
(1)对于有限客户/行业,需要分析的行为特征是哪些?
(2)如何定量分析相似性?
(3)聚类分析的实际过程?
(4)聚类分析结论的实际意义?
本文继续从现实方向讨论此案例,以明确如何利用聚类分析来更好地支持预测。
前文我们简单提到,聚类分析结果是需要有实际意义的。
这里再次重申这一点。
一再重申的意思是,如果分析结论与现实情况不相符,那么最大的可能性是数据本身原因造成的分析结论失真,而不是市场错了。
例如:
对于下图的客户产品结构,相关系数矩阵会告诉你这是高度相关的一个客户群。但是事实上,Prd01和Prd02可能只是这4家客户眼中极不重要的通用附件;如果剔除这两个产品,你就将得到完全相反的结论。
在这里,聚类分析本身并没有出错,出错的只是你对产品结构范围的取舍。或许是因为你对产品理解不够,或许是你没能得到业务人员或产品管理人员足够的支持。
第一个问题:关于行业和产品结构特性
制造业领域总是会有这样的现象:除了大代理商,很少有客户会购买你所有产品线的所有产品,——不要说“所有”,哪怕是超出10%都很少见。而且,越是产品门类齐全,你的客户选用的比例就越低。
原因其实很简单。产品门类齐全,只是说明你想服务的行业众多,但是能通吃所有行业的客户则屈指可数。
但是另一方面,制造业领域还有一个现象是:同一行业的客户,尽管选用的具体产品型号可能千差万别,但是,这些型号所归属的产品类却又是基本一样。
原因也不复杂。因为同一行业的产品技术路线大都是类似的。
这就好比你去超市买调味品,具体买什么牌子什么口味,大家都会不一样;但是既然都是居家过日子,油盐酱醋这几个大类总归是跑不掉的。
但是,不管超市货架再怎么玲琅满目,你买给自家的也只会是其中一瓶,而断然不会是每个品牌每种口味各买一瓶。
所以,前文的聚类分析中,从产品结构所做的分类,实际正是代表了不同的客户行业(或者说细分行业,这取决于你选择的产品树的层次)。
第二个问题:关于行业新客户和新行业客户
处于成长期,典型特征就是会有持续的新客户。也即,你的客户清单会越来越长。
制造业客户选用新品牌产品,是有自身节奏特点的。
第一步,试用测试。体现为样品单或者时间轴上孤立的一张订单。
第二步,小批量试用。
第三步,定型之后批量采购。
取决于选用新品牌的目的,上述节奏快慢会有很大差异。如果是客户新产品定型时候的选用,则会因为客户新品上市速度快慢而不同,不过节奏通常不会很快;而如果是替换现有品牌,节奏往往就会快很多,甚至会跳过某些中间步骤而直接进入批量采购。
这个过程中,是可以从销售数据中观察到这些新客户或者销售记录异常点的。
如果这个新客户属于新行业,那么通常你会观察到订单产品结构特征上的异常。这会给你一定时间去做出响应,比如,是否需要针对性备货。
如果这个新客户属于已有行业,那么通常你观察到的是产品结构特征不变基础上的总量增加。
所以,上述描述实际上是提供了一个“离群点检测”的思路。而这正是数据挖掘技术里面的一个重要实用方法。
(知识点:离群点检测,是数据挖掘技术的核心问题之一。
与数据清洗相反。数据清洗是尽可能剔除掉离群点,使数据质量更高、更能够满足统计假设;而离群点检测则是尽可能识别出离群点,以方便采取针对行动。)
如果我们按照产品结构特征定期对订单记录进行“离群点检测”,就有利于供应链去及时主动发现新的特殊客户。如果该客户涉及到交期敏感的产品,那么,这对于供应链在该客户进入批量采购之前做好准备工作无疑是非常有利的,这将很好地提高供应链对于成长期业务的服务质量。
第三个问题:同一产品结构分组,不同市场趋势分组
通常,制造业用户在选定产品型号之后,其订单就体现出一定程度的稳定性。前期的选型定型周期越长,后期的订单稳定性就越强。
这并非是消费品行业所谓的客户惯性或者渠道惯性,而是因为工业用户选型是有成本的,需要实验测试需要时间;换型则意味着又一次的成本和时间投入。所以,除非遭遇质量问题,否则轻易不会改变。(当然,被竞品以价格等因素切换,则另当别论)
所以,一个产品结构特征分组所对应的一个行业,通常其市场趋势也是一致的。行业大势,是行业里所有客户都难以回避的。
那么,我们在上一篇里所看到的不同市场趋势又是怎么回事呢?
一起回忆一下上篇的结论:同样拥有产品结构特性PG_C的客户,却又有 CG_A和CG_B两种截然不同的季节趋势。
这是因为,即便是同一行业,也会因为行业目标用户的不同、甚至是行业用户地域的不同而体现出市场趋势的差异。
神州这么大,东南沿海入春的时候,东北大地还是冰天雪地,需求不同步,这很正常;作为全球制造业基地,出口目的地那么多,季节趋势不同,这也很正常。
我们的问题是,如何处理这种细分情况?
这里首先需要注意的是该客户分组的成长状况。如果都已经进入稳定状态,那么这两个分组完全可以合并;如果是处于不同的成长阶段,那么合并就存在着一定的风险。
不过,即便是处于不同成长期,如果我们可以拿到较为准确的月度客户用量预测,那么,合并两个分组则也是完全没问题的。
为什么要讨论合并分组的问题呢?
原因在于,预测领域,颗粒度越大,产品预测效果越好;颗粒度越细,产品预测风险越高。
单个客户,受限于客户实际下单过程中的种种设置或者流程、甚至于使用过程中各产品损耗的不同,都会使得每月实际订单出现偏差。但是当很多个客户放在一起考察时,则单个客户的这种偏差,通常都会被群体平滑掉。
有了以上讨论,我们就可以回到另一个重要的技术问题:基于两年整体数据,我们得到了客户分组的产品结构特征,但是这种产品结构是否具有足够稳定性?
如果这种稳定性存疑,那么预测的质量也就可想而知了。所以,在搭建预测模型之前,我们必须要对此予以考察。
如何考察这种稳定性呢?
这个问题等价于,如何考察波动性?
我们知道,对于波动性的表示方式,XYZ是最常用也最简洁明了的一种指标。X表示波动性低,因此可以使用平均值指导后续预测;Z表示波动性强,使用平均值指导后续预测会有较大偏差;Y介于两者之间。
这里我们对“单位金额订单所对应的产品订量”的月度序列进行XYZ分析,计算过程如下图:
请注意:为展示方便,图中隐藏了部分行和列。除透视表外,主要计算公式在右上角。
可以看到,Group_5的部分Y和Z结果,在合并到Group_4+5之后改善成了X或Y,整体展现了较好的结构稳定性。
所有客户分组以及分组合并的XYZ结果,见下图:
可以看到:
(1)Group_1和Group_3经历了高速增长。--从XYZ的计算原理知道,这也是其产品结构稳定性计算结果较差的根本原因。
(2)由于Group_3的增长远高于Group_2,因此,Group_2+3的产品结构稳定性也并不完美。
(3)Group_4和Group_5的产品结构和增速都基本一样,因此,Group_4+5展现了较好的结构稳定性。
借助于前面现实方向的讨论,我们可以合理猜测在上一年(Y2)发生的事情:
(1)Group_1处于高速成长期;
(2)Group_2+3经历了局部高速成长;
(3)Group _4+5处于成熟期。
当然,这些猜测,我们需要与业务讨论确认。
同时,最重要的是:对于Y2的讨论很清晰地告诉我们,必须要先得到业务对于新的一年各客户组别所处市场状态的判定,才能决定新模型里正确的客户分组方式。
另一方面,成长期的市场,各个客户分组的产品结构稳定性又会受到其自身所处的成长阶段影响。
这些认识,都是我们在搭建预测模型时需要充分考虑的。
(本篇完)
基于这两篇的讨论,下一篇我们将讨论搭建最终预测模型,以完成案例2。
这两篇讨论下来,不知道有多少朋友会感叹:怎么会如此复杂?
复杂的原因,在于真实世界就是如此,当然更在于供应链对于交货绩效和存货能够更好平衡的孜孜不倦的追求。
谁都知道,如果我们自己工厂的弹性足够大,根本就不需要在预测问题上面付出这么多。但是,工厂的弹性是有限度的,而且,弹性本身就意味着成本。^_^
下周日再见~~
Tracy:绿色不是成本!
6703 阅读靠供应链暴赚、大建冷链物流,年营收77亿的奶茶品牌冲刺IPO
3219 阅读跃点物流科技获350万美元A+轮融资
2890 阅读顺丰、鲜生活、京东物流、万纬物流、普冷、菜鸟…谁家冷链能在2025实现新突破?
1906 阅读京东物流发布全球织网计划2.0路线图:全面构建海外仓配“2-3日达”时效圈
1581 阅读物流新央企成立!中国数联物流信息有限公司
1181 阅读中力股份上交所主板上市,电动叉车市场迎新机遇
1139 阅读顺丰、圆通、韵达、申通发布最新业绩
1020 阅读顺丰实现全货机国内航班首次可持续航空燃料商业飞行
954 阅读科技助力轮胎制造业转型,菜鸟与华勤集团通力轮胎自动化仓储升级项目正式启动
990 阅读