数据分析入门:如何训练数据分析思维?

勿忘初心2018-11-21 10:57

作者:吴彬彬

欢迎访问网易云社区,了解更多网易技术产品运营经验。


我们在生活中,会经常听说两种推理模式,一种是归纳 一种是演绎,这两种思维模式能够帮助数据分析师完成原始的业务逻辑积累,在此基础上快速定位业务问题,提升分析效率,但是对于刚入门的数据分析师,在项目经验不足的前提下,如何快速完成项目的分析报告? 这里引进一种外展推理的思维模式,方便入门分析师的完成日常的工作。

那什么是外展推理模式呢?

在麦肯锡思维模式中它将人的推理过程涉及的实体分为三个部分:规则,情况以及结果。

  • 规则: 通常是对这个世界的看法;
  • 情况:就是这个世界存在的已知事实;
  • 结果:将规则用于情况,预期要发生的事儿。


这三个任何一个实体都可以作为推理的起点,然而起点不同意味着,推理的方法也有所差异。

  • 以规则为起点的推理方法可以称之为演绎推理。


举个例子,如果平时不努力,考试成绩将不及格(规则);现实中a平时不努力(情况);所以a考试不及格(结果)。

  • 以情况为起点的推理方法就是归纳推理。


a平时不努力(情况);a考试不及格(结果);所以a考试不及格的原因可能是平时不努力。

  • 以结果为起点的推理方法就是外展型思维方法。


a考试不及格(结果),考试不及格通常是由于平时不努力(规则),检查是否平时不努力(情况)。

从日常工作中,我们可以发现,外展推理的思维模式十分切合日常数据分析师的多维分析定位原因的工作模式,是数据分析师尤其是入门数据分析师最应该具备的一种思维逻辑,那如何进行外展推理呢?外展推理用大白话来说就是强迫自己思考产生问题的各种可能原因,之后的重点就是收集资料,以证明是这些原因或不是这些原因。在工作过程中MECE结构化分解是主要手段,按日常的工作可以简化如下三个流程:

  • 将所思考的问题的相关因素全部罗列出来。
  • 对所有相关的因素进行层级和相关性比较,分离不同层级的因素,合并同一层级中相同的因素,确保各因素的独立性。
  • 按照正确的逻辑关系,把各因素进行排列组合。


如下图:我们可以将问题进行分解,分解的原则为

  • 各部分之间相互独立 (Mutually Exclusive)
  • 所有部分完全穷尽 (Collectively Exhaustive)
在此基础上按层级进行数据分析定位,找到最细的原因。

在工作中,我们主要会用到的分解方法有这两种,

  1. 按业务职能结构划分,比如渠道,运营,功能等相关模块,将相关指标映射到主要模块,通过简单快速的沟通,能快速的定位问题原因,但是缺点是分析结果不够直接,依赖外部资源信息搜集。
  2. 按因果结构划分(指标分解)营收=日活*付费率*arpu等指标因果关系进行划分,通过定位指标波动,定位最细指标,辅助维度下转,能够清楚的问题原因,该方式是较为稳妥的方式,是日常工作中的主要方式,但是缺点是需要构建相对完整的指标逻辑体系。

如上两种分解方法针对不同的项目要求进行组合应用,但是外部资源搜集及完整的指标逻辑体系训练是入门数据分析师到资深分析师最难跨越的两道门槛,在经过阶段训练后,逐步利用归纳和演绎的思维,提升业务熟悉程度,完成业务的初始积累后,后续的分析过程中就可以逐步减少拓展推理的层级及组合,逐步提升问题原因定位的效率。



网易有数:企业级大数据可视化分析平台。面向业务人员的自助式敏捷分析平台,采用PPT模式的报告制作,更加易学易用,具备强大的探索分析功能,真正帮助用户洞察数据发现价值。可点击这里免费试用