抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

内容选自简书知乎

数据分析思维

内容选自简书知乎

  • 合理运用各种思维,加以熟悉与运用,获得[[数据敏感性]]
  • 第一种思维:信度与效度思维
    • 总结:
      • 信度
        • 所谓信度是指一个数据或者一个指标自身的可靠程度,包括准确性和稳定性
          • 取数逻辑是否正确?有没有计算错误?这属于准确性;每次计算的算法是否稳定?口径是否一致?以相同的方法计算不同的对象时,准确性是否有波动?这是稳定性。
      • 效度
        • 所谓效度是指一个数据或指标的生成,需要贴合它所衡量的事物,即指标的变化能代表该事物的变化
          • 只有在信度和效度上都达标才是一个有价值的数据指标
      • 例子:
        • 要衡量我身体的肥胖情况,我选择了穿衣的号码作为指标,一方面,相同的衣服尺码对应的实际衣服大小是不同的,会有美版韩版等因素,使得准确性很差;同时,一会儿穿这个牌子的衣服,一会儿穿那个牌子的衣服,使得该衡量方式形成的结果很不稳定;所以,衣服尺码这个指标的信度不够。另一方面,衡量身体肥胖情况用衣服的尺码大小?你一定觉得荒唐,尺码大小并不能反映肥胖情况,是吧?因此效度也不足。体脂率,才是信度和效度都比较达标的肥胖衡量指标。
      • 信度和效度本身实际就是数据质量的问题,是一切分析的基石
    • 感想:
      • 在面对一个需要衡量的事物时,应找到信度高、可靠性高的数据,且此数据贴合需衡量的事物,与此事物有关联性,在找到信度与效度并存的数据时,方可以此为指标进行分析
    • 遭遇与实践
  • 第二种思维:平衡思维
    • 总结:
      • 在数据分析的过程中,我们需要去找到事情间的平衡关系,且平衡关系往往影响企业运转的大问题,如市场供需关系,薪资与效益关系,工作时长与错误率关系等。平衡思维的关键点在于能展示出平衡状态的指标
        • 我们需要去寻找这个准确的量化指标,来观察平衡天平的倾斜程度。
        • 如何找这个量化指标呢?
          • 一般先找到双向型的问题,也就是高也不是低也不是的问题,然后量化成指标,最后计算成某个比率,长期追踪后观察其信度和效度。
    • 感想:
    • 遭遇与实践
  • 第三种思维:分类思维
    • 总结:
      • 分类思维的应用关键在于能在分类后的事物(结果)的关键指标上能拉开距离
        • 也就是分类后的结果必须是显著的
          • 如散点图(自行想象),横轴和纵轴就是运营、分析当中需关注的核心关键指标(不限于二维),而分类后的对象,能看到他们的分布不是随机的,而是有显著的集群倾向
          • 若该图横轴代表购买频率,纵轴代表客单价,那么右上角的那群人就是‘剁手金牌客户’和‘人傻钱多’的典范
    • 感想:
    • 遭遇与实践:
  • 第四种思维:矩阵思维
    • 总结:矩阵思维是分类思维的发展,它不再局限于用量化指标来进行分类。许多时候,我们没有数据作为支持,只能通过经验做主观的推断时,是可以将某些重要因素组成矩阵,大致定义出好坏的方向,然后进行分析。即经典的波士顿矩阵。
    • 感想:
    • 遭遇与实践
  • 第五种思维:管道/漏斗思维:
    • 总结:漏斗思维已经比较普及了,注册转化、购买流程、浏览路径、销售管道等,许多分析场景都能找到这种思维的影子。但越普世越容易理解的模型,就应该应用的越谨慎越小心。在漏斗思维中,我们尤其要注意漏斗的长度
      • 漏斗的环节不应该超过五个,且漏斗中各环节的百分比数值,量级不要超过 100 倍(漏斗第一环节 100%开始,到最后一个环节数值不要低于 1%)
        • 若超过这两个标准,则应分多个漏斗进行观察分析。
        • 超过五个环节时,往往会出现多个重点环节,在一个漏斗中分析多个重要问题容易产生混乱。数值量级差距过大,数值间波动相互关系很难被察觉,容易遗漏信息。
    • 感想:
    • 遭遇与实践:
  • 第六种思维:相关思维
    • 总结:相关思维能够帮助我们找到最关键最重要的数据,排除掉过多杂乱数据的干扰
      • 我们观察指标,不仅要看单个指标的变化,还需要观察指标间的相互关系,有正相关关系和负相关关系
      • 如何执行相关思维呢?
        • 可以计算能收集到的多个指标间的相互关系,挑出与其他指标相关系数都较高的数据指标,分析它的逻辑,对应的问题,并评估信度和效度,若能满足标准,则这个指标就能定位为核心指标
        • 养成一个习惯:经常计算指标间的相关系数,仔细思考相关系数背后的逻辑,有的是显而易见的常识,比如订单数和购买人数,有的能带来惊喜,另外,没有相关关系往往也会成为惊喜的来源
    • 感想:相关思维即为找到数据间的相关性,比如在冗杂的数据中找到进店率与转化率的相关性,客单价与销售额的相关性。
    • 遭遇与实践:
  • 第七种思维:远近度思维
    • 总结:在手握众多数据时,往往注意力是非常的跳跃和分散的,无法迅速找到重要数据,此时就需要远近度思维了。
      • 如何避免?
        • 一是通过相关思维找到最核心的问题和指标
        • 二是建立远近度的思维方式
      • 确定好核心问题后,分析其他业务问题与该问题的远近程度,由近及远,把自己的精力有计划的分配。
      • 例子:
        • 比如:
          • 近期的核心业务是提高客服人员的服务质量,那么客服人员的话术、客户评价通道、客服系统的响应速度等,就是靠近的子问题,需要重点关注。而客户问询习惯、购买周期就是相对远的问题。
    • 感想:
    • 遭遇与实践
  • 第八种思维:逻辑树思维
    • 总结:
      • 一般说明逻辑树的分叉时,都会提到分解和汇总两个概念。为了更贴近数据分析,将其变为下钻上卷
        • 下钻和上卷
          • 所谓下钻就是在分析指标的变化时,按一定维度不断的拆解,比如按地区维度,从大区到省份,从省份到城市,从城市到区县。
          • 上卷则是反过来,随着不断地下钻和上卷,数据会不断细分和汇总,在这个过程中,我们往往能找到问题的根源。
        • 下钻和上卷并不是局限于一个维度的,往往是多维组合的节点,进行分叉。逻辑树引申到算法领域就是决策树。有个关键就是何时做出决策(判断)。当进行分叉时,我们往往会选择差别最大的一个维度进行拆分,若差别不够大,则这一枝不会再细分;能够产生显著差异的节点会被保留,并继续细分,直到分不出差别为止。经过这个过程,我们就能找出影响指标变化的因素。
      • 例子:
        • 我们发现全国客户数量下降了,我们通过客户年龄层级和地区两个维度先进行观察,发现各个年龄段的客户都下降,而地区间有的地区下降有所升高,那我们就按地区来拆分第一个逻辑树节点,拆分到大区后,发现各省的差异是显著的,那就继续拆分到城市,最后发现浙江省杭州市客户流失量巨大且涵盖各个年龄段,被竞争对手的一波推广活动转化走了。于是通过三层逻辑树找到了问题所在。
    • 感想:
      • 逻辑树思维实际上就是找到差异化的数据指标并不断细分,不断将范围缩小,最后找到影响全局的差异指标
    • 遭遇与实践:
  • 第九种思维:时间序列思维
    • 总结:
      • 时间序列思维的三个关键点
        • 一是距今越近的时间点越要重视(越近期发生的事越有可能再次发生)
        • 二是要做同比(指标往往存在某些周期性,需要在周期的同一阶段进行对比,才有意义)
        • 三是异常值出现时,需要重视(比如出现了历史最低值或历史最高值,需要在制作时间序列图时添加一条平均线和平均值加减一倍或两倍标准差线,便于观察异常值)
      • 时间序列思维能够帮助排除掉一些外在干扰,尤其适合一个创新型的分析对象,比如一个新行业的公司,或者一款全新的产品
      • 时间序列有个子概念:生命周期,用户、产品无不有生命周期的存在,自觉上生命周期衡量清除,就能很方便的确定一些阀值问题,使产品和运营更加明确。
    • 感想:
    • 遭遇与实践:
  • 第十种思维:队列分析思维(同期群分析)
    • 总结:按一定的规则,在时间颗粒度上将观察对象切片,组成一个观察样本,然后观察这个样本的某些指标随着时间的演进而产生的变化。
      • 队列分析思维目前使用场景最多的就是留存分析
      • 例子
        • 假设 5.17我们举办了一次促销活动,那么将这一天来的新用户作为一个观察样本,观察他们在 5.18、5.19… 之后每天的活跃情况
      • 队列分析中,指标其实就是时间序列,不同的是衡量样本,队列分析的衡量样本是在时间颗粒上变化的,而时间序列的样本相对固定。
    • 感想:
    • 遭遇与实践:
  • 第十一种思维:循环\闭环思维
    • 总结:业务流程的闭环是管理者比较容易定义出来的,列出公司所有业务环节,梳理出业务流程,然后定义各个环节之间相互影响的指标,跟踪这些指标的变化,能从全局上把握公司的运行状况。
      • 循环/闭环的概念可以引申到很多场景当中,比如业务流程的闭环、用户生命周期的闭环、产品使用功能的闭环、市场推广策略的闭环等等。
      • 例子:
        • 一家软件公司的典型业务流:推广行为(市场部)→流量进入主站(市场+产研)→注册流程(产研)→试用体验(产研+销售)→进入采购流程(销售部)→交易并部署(售后+产研)→使用、续约、推荐(售后+市场)→推广行为……..一个闭环下来,各个环节衔接的指标,就值得关注了:广告点击率→注册流程进入率→注册转化率→试用率→销售管道各环节转化率→付款率→推荐率/续约率……这里会涉及漏斗思维,但千万不要用漏斗思维来衡量一个循环
    • 感想:
    • 遭遇与实践:
  • 第十二种思维:测试/对比思维
    • 即 AB test
    • 总结:
      • 在条件允许的情况下,尽量做对比测试
      • 在测试时,一定要注意参照物的选择,在任何实验中,都应该留有不进行任何变化的一组样本,作为最基本的参照。
    • 感想
    • 遭遇与实践:
      • 遭遇:
      • 实践:
  • 第十三种思维:指数化思维
    • 总结:
      • 指数化思维,是将衡量一个问题的多个因素分别量化后,组合成一个综合指数(降维),来持续追踪的方式。降维,即把多个指标压缩成一个指标。
      • 指数化的好处
        • 减少了指标,使得管理者精力更为集中
        • 指数化的指标往往提升了数据的信度和效度
        • 指数能长期使用且便于理解
      • 指数的设计
        • 要遵循独立和穷尽的原则
          • 独立穷尽原则,即你所定位的问题,在收集衡量该问题的多个指标时,各个指标尽量相互独立,同时能衡量该问题的指标尽量穷尽(收集全)
          • 例子:
            • 当初设计某公司销售部门的指标体系时,目的是衡量销售部的绩效,确定了核心指标是销售额后,我们将绩效拆分为订单数、客单价、线索转化率、成单周期、续约率5个相互独立的指标,且这5个指标涵盖了销售绩效的各个方面(穷尽)。我们设计的销售绩效综合指数=0.4*订单数+0.2*客单价+0.2*线索转化率+0.1*成单周期+0.1*续约率,各指标都采用max-min方法进行标准化。
        • 要注意各指标的单位,尽量做标准化来消除单位的影响
        • 权重和等于 1

评论