0.前言
一个产品,如果你不能衡量它,你就不能了解它,自然而然,你就无法改进它。数据说到底,就是这样一个工具——通过数据,我们可以衡量产品,可以了解产品,可以在数据驱动下改进产品。
数据分析和数据处理本身是一个非常大的领域,这里主要总结一些我个人觉得比较基础且实用的部分,在日常产品工作中可以发挥比较大作用。本期主要讨论一些数据分析的三个常用方法:
1. 数据趋势分析
趋势分析一般而言,适用于产品核心指标的长期跟踪,比如,点击率,GMV,活跃用户数等。做出简单的数据趋势图,并不算是趋势分析,趋势分析更多的是需要明确数据的变化,以及对变化原因进行分析。
趋势分析,最好的产出是比值。在趋势分析的时候需要明确几个概念:环比,同比,定基比。环比是指,是本期统计数据与上期比较,例如2017年2月份与2017年1月份相比较,环比可以知道最近的变化趋势,但是会有些季节性差异。为了消除季节差异,于是有了同比的概念,例如2017年2月份和2016年2月份进行比较。定基比更好理解,就是和某个基点进行比较,比如2016年1月作为基点,定基比则为2017年2月和2016年1月进行比较。
比如:2017年2月份某APP月活跃用户数我2000万,相比1月份,环比增加2%,相比去年2月份,同比增长20%。
趋势分析另一个核心目的则是对趋势做出解释,对于趋势线中明显的拐点,发生了什么事情要给出合理的解释,无论是外部原因还是内部原因。
2.数据对比分析
数据的趋势变化独立的看,其实很多情况下并不能说明问题,比如如果一个企业盈利增长10%,我们并无法判断这个企业的好坏,如果这个企业所处行业的其他企业普遍为负增长,则5%很多,如果行业其他企业增长平均为50%,则这是一个很差的数据。
对比分析,就是给孤立的数据一个合理的参考系,否则孤立的数据毫无意义。
一般而言,对比的数据是数据的基本面,比如行业的情况,全站的情况等。有的时候,在产品迭代测试的时候,为了增加说服力,会人为的设置对比的基准。也就是A/B test。
比较试验最关键的是A/B两组只保持单一变量,其他条件保持一致。比如测试首页改版的效果,就需要保持A/B两组用户质量保持相同,上线时间保持相同,来源渠道相同等。只有这样才能得到比较有说服力的数据。
3.数据细分分析
在得到一些初步结论的时候,需要进一步地细拆,因为在一些综合指标的使用过程中,会抹杀一些关键的数据细节,而指标本身的变化,也需要分析变化产生的原因。这里的细分一定要进行多维度的细拆。常见的拆分方法包括:
分时:不同时间短数据是否有变化。
分渠道:不同来源的流量或者产品是否有变化。
分用户:新注册用户和老用户相比是否有差异,高等级用户和低等级用户相比是否有差异。
分地区:不同地区的数据是否有变化。
组成拆分:比如搜索由搜索词组成,可以拆分不同搜索词;店铺流量由不用店铺产生,可以分拆不同的店铺。
细分分析是一个非常重要的手段,多问一些为什么,才是得到结论的关键,而一步一步拆分,就是在不断问为什么的过程。
4.小结
趋势,对比,细分,基本包含了数据分析最基础的部分。无论是数据核实,还是数据分析,都需要不断地找趋势,做对比,做细分,才能得到最终有效的结论。
那么,怎么使用这些数据分析技巧,形成一个完整的数据分析报告?
————————————
参考资料,书籍推荐:
王彦平 吴盛峰《网站分析实战:如何以数据驱动决策,提升网站价值》
Avinash Kaushik 《精通Web analytics 2.0:用户中心科学与在线统计艺术》
1. 前言:
一个项目到了汇总的时候,免不了形成一份相对完整的数据分析报告。
报告也需要多种情况。按照应用场合可以划分多种类型:有的需要向上邮件汇报,有的需要给项目组里一个交代,有的是需要直接进行展示汇报等。按照项目类型也可以划分多种类型:新项目上线效果评估,AB test结果,日常数据汇总,活动数据分析等。
文本也好,PPT也罢,数据分析报告核心的思路都是相通的。
2. 你要一个故事
我自己有个想法,就是产品经理应该多学习相关领域的知识,比如学一些基础的设计规范、交互原则、营销知识,心理学知识,算法知识等等。除了一些明显的对工作的帮助,也能帮助自己扩展思路。其实做好报告,就应向咨询机构或者投资机构学习。
一个报告核心不是包含很多内容,让听众或者读者去花时间理解,核心是讲好一个简单的故事。咨询和投资机构做BP之前,会先花时间理清楚storyline。其实各种报告都应该这样,先理清楚你要讲的故事。
3.一个数据分析报告的框架
这里列出一个我个人比较喜欢的报告框架,可能针对不同的报告场景需要有所调整(比如删除部分步骤,或者增加部分细节):
4. 项目背景&项目进度
项目背景,需要简述项目相关背景,为什么做,目的是什么。项目进度,需要综述项目的整体进程,以及目前的情况。这两点其实没什么可说的,如果对象是项目成员,可以写简单一些,如果对象是对项目不了解的人,则需要多写 一些,但还是要尽量用最简单的话,跟别人讲明白。
5. 名词解释&数据获取方法
名词解释:关键性指标定义是什么,为什么这么定义。这点是很多人忽略的,其实很多时候数据的误解都是因为对指标没有统一的定义。举例而言,点击率可以是点击次数/浏览次数,也可以是点击人数/浏览人数。人数可能按访问去重,也可能按天去重。如果没有清晰的解释,不同人理解不同,对整个数据的可读性就大打折扣。
数据获取方法:如何取样,怎么获取到的数据,会有哪些问题。原始数据往往有一些缺憾,要经过数据清洗剔除噪声,也需要部分假设进行数据补全。数据清洗和数据补全的方法需要跟汇报对象说明并且获得认可,让对方对于置信度有一个估计。
6. 数据概览&数据拆分
数据概览,需要有重要指标的趋势,变化情况,重要拐点成因解释。
数据拆分,需要根据需要拆分不同的维度,作为细节补充。
这里基本上就是之前说的数据分析方法了。如果需要对方知道对比或者趋势,则使用图,如果需要对方知道具体数据,则使用表。表格对需要强调的数字要做明显标识。需要注意的点是:核心指标要少而关键,拆分指标要有意义且详细。同时如果是PPT的话,每页说明白一个结论或者解释清楚一个趋势足以。关键性结论要用一句话能说清楚。
7. 结论汇总&后续改进
结论汇总,基本是对之前数据分析阶段的数据进行汇总,形成完整的结论。
后续改进,需要在数据分析的结论和问题的基础上,对后续的迭代和改进措施作出方向性的说明。这部分其实很多时候也是分析的根本目的。
8. 致谢&附件
致谢是对项目组合相关协助部门的致谢,基本上对于项目组和相关协助部门而言,也希望自己的工作或者积极配合能看到有效的数据结果。在之后的合作中,也会更加融洽。
附件是需要附赠更多没有必要在数据报告中体现但是仍然有价值的数据。对于PPT而言,这部分也可以放在PPT致谢之后,与会同事有疑问,可以随时翻到最后解释。
9.总结
一个产品,如果你不能衡量它,你就不能了解它,自然而然,你就无法改进它。这是说数据。
而数据报告的意义也是类似,项目完成之后需要完整汇报,这样无论是对上汇报还是对团队而言,都是有重要意义。
突然想到一个事情。去年的时候做了一个内部数据平台,到了取名字的时候,我用了dice。为什么叫dice呢?
这得从物理说起(开启神棍模式)。物理学不断前行,之前人们认为物理学是决定论的,只要知道系统的初始值和足够细节,就能知道之后系统的演化路径。后来发现不是这样的,对于一个基本粒子而言,观测之前,粒子状态和位置是不可预测的。爱因斯坦说“上帝不会掷骰子”,然后后续的研究,更多的是支持上帝是掷骰子的。这也是dice的来源。
即使是上帝视角,也不可能知道提前知道数据的结果。那么作为产品经理而言,尊重数据结果,并分析形成结论,远比相信一些所谓的方法论的条条框框好得多。
关于数据,能讲的还有很多,之后再开新坑。
————————————————
书籍推荐:
王彦平 吴盛峰《网站分析实战:如何以数据驱动决策,提升网站价值》
Avinash Kaushik 《精通Web analytics 2.0:用户中心科学与在线统计艺术》
阿利斯泰尔·克罗尔 / 本杰明·尤科维奇 《精益数据分析》
既然来了,说些什么?