撰写数据分析报告时,如何将数据转化为有价值的建议是许多数据分析师面临的难题。本文通过一个具体的考勤问题场景,详细介绍了如何从问题出发,通过假设验证、逻辑树梳理和数据支持,最终得出有理有据的结论和建议。你不要光报数字!要提出可行的建议!很多做数据的同学都被领导、同事这么吆喝过。然而,到底怎样才能做到?陈老师有一道经典的练习题,今天分享给大家。问题场景:公司里,某同学的考勤表如下图: 该同学:“加班了,迟到很正常呀!”“大家都迟到,为啥只抓我呀!”“那突然下雨了,我也没办法呀!”“就是各种意外呀!”领导:“我看就是你态度有问题!不要扯其他的!”两人激烈争吵!此时,该怎么分析?一、不可落地的建议有没有同学,是这么写的本月共22个工作日,迟到11个工作日,迟到率50%迟到最多的是第二周,共迟到4天,迟到率80%迟到最少的是第三周,共迟到1天,迟到率20%迟到天数太多,建议搞低周一迟到太多,建议周一不迟到是不是工作中,很多人的报告都长这样?显然,这样的报告是不合格的!这只是把图表又念了一遍,没有回应大家真正关心的问题,“要搞低”也是一句空话在争吵中,业务的核心问题是:到底是真的意外情况,情有可原。还是态度问题。正面解决这个问题,才能得到满意的答案。显然,眼前的数据是不够的,我们要先列出验证假设的思路,再增补数据,从而全面解答问题。二、破题的思路列假设→找证据→验真伪→得结论,是解题的基础顺序。用数据分析业务问题,一定是从粗到细,逐步验证的过程比如简单的一条:“我家离得很远,所以很容易迟到”。我们可以提炼出假设:家到公司是否真的很远。而验证假设,并不需要复杂的数据,只要在高德地图输入起点/重点,就能看到:距离多远坐地铁需要多久坐车需要多少钱,需要多久一些简单的分析结论,就呼之欲出了(如下图)用数据解题,就是这么清爽,不需要争吵,按事实说话。当然,当假设很多的时候,可以有验证的先后顺序。比如,我们可以先把“情有可原”类假设列清楚,比如:假设1:前一天加班假设2:当天所有人都迟到假设3:当天有极端恶劣天气列出假设后,每一个假设逐一找证据。比如假设1:前一天加班 → 抽前一天上班/下班时间,看是否加班假设2:当前所有人都迟到 → 抽当天所有人打卡记录,看迟到比例假设3:当天有极端恶劣天气 → 查当天是否有暴雨/下雪信息如果连数据证据都没有,说明假设是随口编的,就能直接推翻了,如果发现真的情况都符合,比如人家真的加了很多班,缺数“情有可原”,那么就能输出:“确实加班太多,建议提醒即可”的结论,还人家清白三、从简单到深入有时后,简单验证几条假设,不足以全面说明问题。比如前一天加班,既可以因为个人能力不行/个人磨洋工,也有可能是整体工作任务多。所以,还可以进一步做细化假设:假设1.1:全部门工作量都大假设1.2:全部门工作量不够大,但个人承担太多假设1.3:个人承担不多,但能力不行,做的慢进一步验证三条细分假设,这样就能把分析从粗到细,逐渐深入。最后形成一个完成的答题思路。看到这里,同学们可以重新调整下自己的答案哦,再看后续讲解四、整体思路把多个分析假设,按顺序组合好,就可以得到如下图分析逻辑树。可以看到,这个分析逻辑树,是从“是否加班影响”出发的,优先排除集体加班、分配工作太多等客观影响。这样的顺序,可以有效避免员工被冤枉(如下图)列好逻辑树以后,只需代入相关数据,就能找到重点,辨别真伪。比如发现该同事,11个迟到,有8个都是因为分配工作太多,个人承担工作量明显高于组内同事,那么就坐实了他是被冤枉的。如果发现,11个迟到,只有俩是真加班,其他9个都是没有加班且自己没打车,那说明态度可能真的有问题。数据指引我们,找到更接近真相的答案。有了以上的铺垫,推导建议就能有理有据了,而且非常具体(如下图):五、回到现实工作当然,上边只是一个简单的小例子,但是清晰地反映了现实中问题:业务部门往往处于本位主义思考,喜欢说:“这是大环境问题”“这是意外问题”“我已经很努力了”数据部门往往陷入数字游戏,过于关注计算同比环比,不会提假设,不会针对假设找证据,不会细化假设这样都是不利于得出正确的结论和建议的本文由人人都是产品经理作者【接地气的陈老师】,微信公众号:【接地气的陈老师】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。题图来自Unsplash,基于 CC0 协议。