01信度与效度思维
信度与效度的概念最早来源于调查分析,但现在引申到数据分析工作的各个方面。
信度是指一个数据或指标自身的可靠程度,包括准确性和稳定性。
取数逻辑是否正确?有没有计算错误?这属于准确性;每次计算的算法是否稳定?口径是否一致?以相同的方法计算不同的对象时,准确性是否有波动?这是稳定性。
做到了以上两个方面,就是一个好的数据或指标了吗?其实还不够,还有一个更重要的因素——效度。
效度是指一个数据或指标的生成,需贴合它所要衡量的事物,即指标的变化能够代表该事物的变化。
只有在信度和效度上都达标,才是一个有价值的数据指标,例如,要衡量我身体的肥胖情况,我选择了穿衣的号码作为指标。
一方面,相同的衣服尺码对应的实际衣服大小是不同的,会有美版、韩版等因素,使得准确性很差。同时,一会儿穿这个牌子的衣服,一会儿穿那个牌子的衣服,使得该衡量方式形成的结果很不稳定。所以,衣服尺码这个指标的信度不够。
另一方面,衡量身体肥胖情况用衣服的尺码大小?你一定觉得很荒唐,尺码大小并不能反映肥胖情况,因此效度也不足。
在现实工作中,许多人会想当然地拿来指标就用,这是非常值得警惕的。你要切骨头却拿了把手术刀,是不是很可悲?信度和效度的本质,其实就是数据质量的问题,这是一切分析的基石,再怎么重视都不过分。
02平衡思维
说到天平大家都不陌生,平衡思维相信各位也都能很快理解。简单来说,在数据分析的过程中,我们需要经常去寻找事情之间的平衡关系,且平衡关系往往关乎企业运转的大问题,如市场的供需关系,薪资与效率的关系,工作时长与错误率的关系等。
平衡思维的关键点,在于寻找能展示出平衡状态的指标!也就是如图中红框,我们要寻找这个准确的量化指标,来观察天平的倾斜程度。
怎么找这个指标呢?一般人的经验是先找双向型的问题,即高也不是低也不是的问题,然后量化为指标,最后计算成某个比率,长期跟踪后,观察它的信度和效度。
03分类思维
客户分群、产品归类、市场分级、绩效评价.......许多事情都需要有分类的思维。主管拍脑袋也可以分类,通过机器学习算法也可以分类,那么许多人就糊涂了,到底分类思维怎么应用呢?
关键点在于分类后的事物,需要在核心指标上拉开距离!也就是说分类后的结果必须是显著的。如图中的横轴和纵轴往往是你运营中关注的核心指标(当然不限于二维),而分类后的对象的分布不是随机的,而是有显著的集群的倾向。
例如,假设该图反映了某个消费者分群的结果,横轴代表购买频率,纵轴代表消费单价,那么绿色的这群人,就是明显的“人傻钱多”的“剁手金牌客户”。
04矩阵思维
矩阵思维是分类思维的发展,它不再局限于用量化指标进行分类。许多时候,我们没有数据作为支持,只能通过经验推断,可以把某些重要因素组合成矩阵,大致定义出好坏的方向,然后进行分析。
05漏斗思维
这种思维方式已经普及:注册转化、购买流程、销售管道、浏览路径等,大多数的分析场景中,都能找到这种思维的影子。
但看上去越是普适的、容易理解的模型,应用时越得谨慎和小心。在漏斗思维中,我们尤其要注意漏斗的长度。
漏斗从哪里开始到哪里结束?以我的经验,漏斗的环节不该超过5个,且漏斗中各环节的百分比数值,量级不要超过100倍(漏斗第一环节100%开始,到最后一个环节的转化率数值不要低于1%)。
理由是什么呢?超过5个环节,往往会出现多个重点环节,那么在一个漏斗模型中分析多个重要问题容易产生混乱。数值量级差距过大,数值间波动相互关系很难被察觉,容易遗漏信息。例如,漏斗前面环节从60%变到50%,让你感觉是天大的事情,而漏斗最后环节0.1%的变动不能引起你的注意,可往往就是这0.1%的变动非常致命。