般聊到如何做数据分析的文章,从各个视角去介绍数据分析的思路和流程。但今天篇文章,不告诉你怎么按1234的步骤做数据分析,而是告诉你在数据分析中,不要做什么。
正如查理芒格所言:“在生活和事业,很多成功都来自于你避免了某些事情:比如早逝、糟糕婚姻等。” 我相信,和“要做到好而深入数据分析”相比,“不在数据分析踩坑”会是更易于执事情,这是也这篇文章诞生原。
的错误集合,都是从身边的真实案例总结而来的。从错误发,会给我们认为正确的做法和思路,希望对大的真实工作场景有启发。
典的场景是,领导和你说:明天交一个总结ppt给我。这时候你才想起来数和分析,很可为时已晚。如果是规的数据可看的数据平台获取;但如果是个性的看数需求,就必须经历这些步骤:确定埋点方案、开发埋点、与数据分析师的具体数需求沟通、实际数、整数据、最终分析。在这么长的链路中,如果有哪一步漏了,都有可导致你拿到想要的数据。
解法:从项目初始阶需要有数据思维
正确是怎样呢?应该是从项目开始,根据你案,去定义你应该看什么数据来衡量最终设计成败。这样来好处是,首先会倒逼我们从考虑案时候,专注于能带来实数据提升案,避免自嗨型案、没有办法衡量结成败案;其是这样才能保证,我们在埋时候不会漏掉本该埋数据,避免最终上线出现没有埋数据,导致法衡量结情况。
不了解基本数据指标概念,也是个常犯误。例如说我们常遇到团队新会有这样疑问:客单价和 UV 价值有什么?UV 击率和曝击率有什么?这是于数据指标基本概念理解不足造成。如连指标都含义都没有了解晰,于进步数据分析头雾也是难免。
解法:从定义来初步认识,从影响素和场景来加深理解
首先,最简单粗暴,是读指标解释。般数据平台都有地专解释这个指标背后公,这些解释会帮助我们立不指标初步理解。前也写过篇文章《电商设计,你必须懂10条数据指标》,希望能加深大家于数据指标理解。
更进步,有两个度可以尝试去思考。例如以客单价和单 UV 价值案例来说,第个度,是看这个指标关键影响素。像客单价,是更容易受到货属性影响,奢侈品客单价天然会趋于比消费品客单价更高;单 UV 价值,更容易受到流量质量影响,比如把促销敏感型用户导入了奢侈品频,这个时候,般 UV 价值是会极低,而客单价可能没有太大变化。第个度是看这个数据指标使用场景。如客单价,可以用来看这个业务品类特征如何,UV 价值,是用来看流量与业务匹配度,以及判断业务潜力。比如,看要不要到这个业务更多资,可以看 UV 价值,为 UV 价值高,代表了这个地更多类流量,它 GMV 会更高。
个典型案例,是看了 GMV 上涨,下定论说代表我策略是成功。为什么有问题呢?为 GMV 上涨是各变量综合导致结,如不去深入分析其到底是什么变量导致了 GMV 上涨,是不能接跳过逻辑链去下判断。
解法:拆公、拆链路
首先是从式上直接开始分析。假设你之前的策略是提升转化率——么在上图的式拆中,虽最终的gmv是提升的,但因为gmv提升主要是由浏览UV的提升带来的,因此转化率相关的策略以说是失败。
二个思路,是由观到微观的方式去排查问题的方式。电场中,我们以先看易数据,看下是否达到当初的预期,与历史对比是涨还是跌;看流量数据,因为流量是影响 gmv的最大因素之一,时就以分析易数据的涨跌,是否是因流量的涨跌导致的;或者说是流量质量导致的转化率低等等;果分析完,现流量的影响不大,时以进下一级,去分析核心的节点是否存在问题。比在电黄金流程场中,我们看搜索、详、加购等核心页面的漏斗;而在大促场中,我们能去看主场的主推楼们是否达成预期的产出。个就是以观到微观去排查问题的思路。
有时,我们的分析看来有理有据、是有数据支撑的,初步看来逻辑没有大问题。例说,根据以下个点击率的图表,似乎以直接推测出个页面里,除XX楼以外,其他的楼表现不佳。是我们以直接下结论说:未来还做样的页面的时,迭代的方向,就是直接把表现不佳的楼去掉,只留下个表现的楼吗?——样的结论是失之轻率的。到底问题出在哪里呢?
问题在:我们似乎建立一个前提,即样的数据结论是仅仅源自“楼的定位或者设计”一个变量而导致的。因此数据=楼的定位和设计成功,要延续;数据差=楼的定位和设计成功,要复用。但是现情况,永远比我们设想的要复。仅抓一条变量就贸下结论,风险是比大的。
法:找到各种关键变量,排除或确认个变量的影响
回到业务场,现还有更变量。在个案例中,我们二个要考虑的变量,是流量渠道。以上图表是APP的楼数据,么M端是否是一样的趋势呢?拉出来M端的点击率图表一看,现趋势完是不一致的:
此时有一个猜测:APP端流量更内部自流量,M端更外推流量,因此我们以得出,个点击率反映的是JD自有流量和外推流量对个页面完不同的行为特征。
那为什么带来用户和站内用户,个页需求异那么大呢?为这是个以 IP 内容为主页,页大部分区域都是 IP类商品,是带有定粉丝。到页很下才有 IP 度商品,这里商品是全品类。说到这里,大家应该意识到了:这里有第三个变量——楼层内容异。此时把第个变量与第三个变量交判断,是本数据分析关键问题:楼层内容与流量渠匹配度高低。
根据上分析,我们可以出最终结论:
- 外推带来的用户,对页面的主推 IP 内容更感兴趣,说明次外推触达的用户是更精准符合个页面的用户群;
- 而站内用户,于页主内容是缺乏兴趣,有看到全品类楼层才有兴趣,说明站内自有流量与本 IP 页不太匹配;
- 综上,在后续进行同类的 IP 页面的营时,若想要达成更精准的人货匹配,建议把流量重点放在外推的流量上,而降低对流量的效果的预期。
以上是如何排除各自变量影响分析案例。基本思路是:不要满足于你手上抓住那条变量,而是尽可能多地找到这个场景里关键变量,再个个变量去排除或者确认它影响,最终才到较合理结论。
结以上问题,发现这些问题本质上是从分析小白→到分析进阶者遇到些槛。如下图样,要输出份符合逻辑、能业务有实帮助数据分析,我们需要避免踩到这些坑。
而我们解法,有踏实做好以下事情:
- 在链路有数据意识,避免在最一步才想要数据分析;
- 数据指标有基本认识,避免拿着指标头雾;
- 分析时要有溯源逻辑,避免仅通过一个指标判断成败;
- 穷举各种可能的变量,避免只抓一个变量就下判断。
上就是于数据分析如何才踩坑的个人心得,如果有任何数据相问题想讨论,在章方留言~
欢迎关注「JellyDesign」的程序: