网易数帆小助手

个人签名

55篇博客

数据分析指标篇——指标设计

网易数帆小助手2021-08-19 17:45

数据指标,并不是数据分析和业务同学的专属模块。日常会用到数据指标的,还包括开发(比如机器资源利用率,选仓选配计算平均时长等),产品(自动罚款功能使用率,自动调拨推荐转换率等),以及测试、设计等等。


精准的指标,能提供好的方向,明确目标,更好的指导工作。优秀指标解读思维,能让自己辨识重要度,抓住问题关键。以及系统的指标体系,能够全面完整的覆盖关注范围,以及精准快捷的定位问题。数据分析指标篇会分为三篇:指标设计、指标解读、指标体系建设,进行介绍和案例分析,帮助大家在这几个方面有更加深入的了解和提升。


指标设计基础

指标的设计链路,可以从目的→设计→公式→口径&范围,每一步都需要跟使用场景强绑定。所以当面对不同的使用场景时,同一个指标可能有多套口径的情况。比如说客诉率,我们考核的时候,会考核一年的情况,但是日常观察,会只观察一周或者一天,同时需要保证客诉的订单和购买的订单是用一波订单,解决时间错位的问题。


因此,我们在对指标设计时,需要时刻注意指标的定位是否清晰,以及是否在所使用场景下是逻辑合理的。以下我们来详细讲述一下指标设计过程中每一块需要注意的事项。


——1——

目的


任何指标都有存在的目的。我们可以通过实际的目的,去设计对应的指标的计算方式。


从业务视角,往往都可以分为几个大的类,比如供应链业务中的三个主要模块:成本类,时效类,体验类,以及前端商品营销关注的用户类,流量类,商品类,营收类等等。


从计算视角,【量指标】的目的,是反应的是实际的规模、量级,比如活跃用户数,GMV,履约成本;【比值指标】则是反馈单位效能,如库转、arpu;【比率指标】则是更多用于评估占比情况,如毛利率、退货率、流量转换率等。


——2——

设计


个好的指标设计,需要有明确的指向性,也就是目的性明确,能指导使用方的效率、收益、质量等。


举例1:缺货率。

对于实际生产或者汇报,这个值就是越低越好,因为不缺货,我的GMV就不受影响

举例2:GMV。

越高越好,这个就不用多解释了。


反面例子:

举例3:仓内生产人数。

当这个指标值很大,可能存在人力成本浪费;如果值很小呢,又可能会造成生产进度达不成。

改进方法:①结合其他的指标一起,形成一套指标体系,比如加上仓内生产准时率,期望人数等;②直接看人均产能。


这类指标表现出来的问题在于,数据的大小或者多少,并不能真实的给出好坏优劣的判断。


——3——

公式


到公式阶段,就需要对指标的具体计算逻辑有很明确清晰的思考了。指标的公式,尤其是不常见的指标,对设计者的要求其实是很高的。经常看到经验很丰富的业务方,在指标的公式上面犯错误。以下跟大家分享两个比较常见的坑。


坑1:计算【库转】,库存是用平均值,or截面值?

库转最原始的公式,库转(成本)=库存成本/销售成本。业务角度来讲,我们希望库转这个指标作出的指导是,看下当前的库存能售卖多少天?因此,为了让指标能更科学,分母部分的销售成本,我们使用的是最近30天的平均销售成本,目的是能更好的的平均掉促销活动带来的销量波动。


那么分子部分的库存成本呢,也用平均值么?其实不然,如果是想反馈当前的库存,多少天能销售光,那么历史的库存信息,是并不需要关心的,所以分子部分,使用的是截面库存成本值。


指标具体每一部分的计算逻辑,需要结合指标本身所想表达的意义去做公式设计,跟业务运作的逻辑强相关。


坑2:计算【客诉率】,分子分母会有时间差,那么是否需要去掉时间差?

跟时间链路有关的指标,往往都会有时间差。很容易出现研究的不是同一拨对象的问题,指标的解释性差。我们以客诉率为例,客诉率=客诉单量/支付单量,这里要讨论的问题就是,假如取11月11日的客诉率,客诉单量在11月11日会有发生,支付单量在11月11日也有发生,如果两者直接相除,可以得到一个值。


但是11月11日发生的客诉单,并不一定是在11月11日支付的,可能是11月10号,9号,8号,甚至更早之前。因此分子和分母研究的订单并不是同一拨。以及会出现客诉量跟以前差不多,但是支付订单量在双11期间会有一个比较大的涨幅,在这一天整体的客诉率会有一个比较明显的下降,然后再后一段时间,比如11月15号,用户陆续收到货了,双11期间的订单客诉起来了,但是对应的分母部分订单量回到了正常水平,导致了客诉率变得特别高,从而形成了如下图的变化趋势。


这种由于计算方式的问题导致的指标波动,不利于我们通过这个指标去分析问题和定位问题。




修正问题的方法很简单,就是让分子是分母的一部分,客诉率转变为T-7客诉率。具体的定义为:T-7客诉率=T-7支付单中在后续7天有发生客诉的单量/T-7支付单量,这样,就能规避掉促销活动带来趋势上的狂抖。


当然这个指标也有弊端,就是滞后性。我们只能看到7天前的情况,最近的表现就无法获得了。


——4——

口径&范围


日常的业务沟通过程中,经常出现同样的指标,你说是A结果,我说的是B结果,这种情况一般都是互相之间没有对指标的口径或者范围对齐。


比如商品成本,可能一部分人说的是含税商品成本,另外一部分人说的是不含税;再比如单量,不同的部门会分别默认是订单量,出库单量,以及运单量,售后单量等。基于这些异常场景的考虑,我们需要根据指标的实际使用逻辑,给出详细的口径和范围的注释。


我们也可以在指标命名上,可以更细致,比如说,不含税商品成本,2c订单量,主站付费用户数,等等。以及范围,我们有时候需要详细的给出包含的信息有哪些,比如履约成本,包含内仓和外仓的,不含海外的,不含品控费用,等等。所以当一个指标有较大范围的交流使用时,我们需要从指标命名上进行规范,最好沉淀一份指标使用白皮书,对口径和范围进行收口,统一管理以及公示。


这一点行业内是怎么做的?这里可以参考一下阿里oneDate的标准规范,用在严选可以这么来解释。




这种方式的实现,需要先进行指标命名的规范,使用的规范,进行全员的宣导和培训,统一使用习惯,教育成本较高。


——5——

总结


当前各行各业对于数据的依赖程度越来越高,而数据指标可以说是数据使用的元件,是把数据用活的第一步。严选所处的电商行业,算是复杂度最高的行业之一(相比我以前所处的游戏行业要复杂得多)。


在高复杂度的业务场景下,每一个人都有机会经历从简单到复杂的成长历程,以及任何一个阶段最核心的,都需要去深入的体验业务,摸透业务流程。最后就是,数据指标的设计,要带有目的性,让指标活过来,让使用者/观察者感受到指标的生命力。祝好~


|作者简介|


九饼,网易严选数据分析师,数据爱好者,认为数据可以改变世界。现负责严选主站和供应链的分析工作。