广东快乐10分预测

当前位置:广东快乐10分预测 > 广东快乐10分预测 > 出品数据分析的三板斧

出品数据分析的三板斧

来源:http://www.btxygg.com 作者:广东快乐10分预测 时间:2019-11-14 21:19

而实际上的卸载曲线的峰值会更快与更高,因为一个普通的新用户对于一个陌生App的耐受程度是非常低的。在使用App的前几分钟内,如果觉得不爽,那就会毫不犹豫的删除掉,这关键的几分钟也被称之为:新手窗口期。

对比分析

趋势分析是在一段时间中,比较时间前后数据指标的趋势变化。但是我们还与遇到这样的问题,需要验证新的产品方案的效果是否达到预期,这时候我们会使用对比分析的方法。我们可以简单地把比较测试分为两类:基于时间序列的组内比较基于对照试验的组间比较

数据分析工作,很大一部分是为了“预测”。所有预测模型的“根基”都是“通过过去发生的事来预知将来的事”。说得更玄乎一点,就是“历史是会重演的”。但这个基本逻辑靠得住吗?
从我的个人经历来说,许多时候是靠不住的。这也是我在工作中很少进行预测型建模的原因。在我所处的互联网行业,业务变化非常快。一个“政策”的决定,往往造成各项业务数据的巨变。经常是“一夜回到解放前”或者“一晚跨入新时代”。在这种背景下,重要的不是去对某个指标进行预测,而是理解业务背后最根本的商业逻辑(商业模式)。若一个商业逻辑被证明是有效的,那么它在相当长的一段时间内不会变化,那么你就能获得一些“定性”的预测能力,这就足够了。
大多数人会因数据而变傻

笔者基于自己工作中遇到的一些产品数据分析问题,与大家分享其对于数据分析的见解与感悟。期望以简单易懂的文字让产品数据分析小白,能通过改文章对数据分析有一定的了解。

同比

同比增长率是为了消除数据周期性波动的影响,将本周期内的数据与上一周期中相同时间点的数据进行比较,比较常见的是今年月度数据同去年月度的数据进行比较

同比增长率 = (本期数据 - 上一周期同期数据)上一周期同期数据 * 100%

数据库并不能记录一切

原则上肯定是公司新人,虽然之前员工甲对于A公司爱过、痛过,但毕竟现在是重新来过!

定基比

定基比增长率将所有的数据都与某个基准线的数据进行对比。通常这个基准线是公司或者产品发展的一个里程碑,将之后的数据与这个基准进行比较,从而反应产品在跨越这个节点后的发展状况

通过以上指标我们就可以分析一段时间产品指标的趋势了,不过在精细化运营的大背景下,很多时间我们通常要按天为单位进行分析,不过时间粒度缩小之后,数据指标会存在周期性变化或者波动,这时候需要使用同比环比监控法来监控数据

为什么这么说呢?在我的工作经历中,大多数的管理层,都会因为数据资源的丰富而或多或少地放弃思考。放弃思考意味着变傻,难道不是吗?许多人,自身因为长期业务经验的积累,其实是有很好的直觉的。而现在,却被一个不熟悉业务,只会从数据库中做些统计的所谓数据分析师牵着鼻子走。实在是“可歌可泣”。许多人过分地依赖数据统计了。这个现象是值得警觉的。
曾经有一位学者告诉我,数据分析使人短视甚至盲目。开始我不以为意,但之后越来越觉得这话有道理。为什么呢?现实情况是,许多人有了数据资源后,放弃了最基本的商业思考,不断地去统计数据,不断地去提“帮我查一下这个数字,帮我看一下那个数字”这样的需求。失去了思考的深度,非常危险。
我觉得,真正的数据分析(业务分析),应该有很高的门槛。这个门槛并不来自于分析方法的应用,而来自于对业务的理解。只有对业务有深刻的理解,才能将分析方法用对地方,才能正确地解读信息,获得结论。
所以,许多深耕在业务中的管理者,不需要因为数据资源的爆炸而惊慌失措,真正有价值的东西在你们经验里,只需要有一个量化的出口,你才是那个将数据价值发挥到最大的人。
那么问题来了,如何做到不因数据而变傻呢?我没有答案。我认为在未来,不应该有数据分析师这个职业,而应该是所有决策者都懂得“分析数据”。这实际上是写作本书最深层的一个目的。当所有决策者都能正确地获取数据、合适地应用分析方法,得出可靠的结论时,我们的商业将进入一个新的阶段,商业智能才真正落地。
最后,我还是想强调,任何人在应用数据前,都要记住这样一句话:“对业务的理解和思考,永远高于分析技术的选择”。

或许看完了以上四个问题,你心中充满了困惑,这里建议你再重新看一次『用户数量的基本单位』的阐述——如果我们以App id为基本单位,则一切以App的时机数量为准。 所以,前两个问题的答案就迎刃而解。

环比

环比增长率反应的是数据连续变化的趋势,将本期的数据与上一期的数据进行比较。最为常见的是这个月数据与上个月数据进行比较

环比增长率 = (本期数据 - 上一周期数据)上一周期数据 * 100%

一个逻辑混乱的人,给他再多的数据,也不会得出正确的结论。能否形成正确的判断和合理的决策,很大程度上并不是数据的多少,数据足够(信息充分)就可以了。很多时候,我们真正要锻炼的是自己的分析问题的能力,或者说逻辑思维能力。尤其是在“根据数据变化查找问题”这样的场景中。
要对这一点有深刻的理解,希望大家读我的《数据驱动决策的13种思维方式》。你是不是一个明智的决策者,并不在于你手头有多少的数据,而在于你能否从数据中正确地解读信息。需要提醒各位的是,当数据达到一定的量后,数据越多,往往数据质量越差,你犯错的可能性越大。你是否记起了本书第一章最后部分,数据图中指标数量与混淆概率的关系了?
预测的根基未必牢固

实际上,目前市面上常见的数据数据统计平台,还没有能力真正识别一个真正的人。

趋势分析

在日常的工作中,我们经常会遇到这样的问题

  1. 产品已经获得一部分用户,不过用户数一直是在波动过程中的,产品经理需要知道用户数量是处于上升趋势还是下降趋势
  2. 产品经理需要掌握产品的运营情况,需要及时发现产品哪些地方可能出现了问题,希望有一些检测数据可以帮助分析问题

在遇到这些问题时,我们通常会拉出一段时间产品某项数据指标的曲线,分析该指标在这段时间中是处于上升还是下降趋势。在分析趋势时,我们通常会用到是哪个指标:同比、环比、定基比

我们在运营当中最容易犯的错误就是试图用一个“宏观指标”的变化来评估某个细节动作(策略的改变、产品的改变或者活动的改变)的影响。做这件事情好比买彩票,幸运的时候,某个运营动作对业务的影响非常大,那么从指标中能反映出来。但绝大多数时候,不管是策略的变更还是产品的改进,对业务全局的影响都是有限的,宏观指标(往往是KPI)的变化并不敏感。真正要做的是就事论事,根据具体的行动,去定义一个信度和效度高的指标。
另一个角度,业务指标的变动往往是多种运营动作共同施加的结果,这种影响并不能简简单单的分解为“A B C …”或者“A*B*C*…”。有些因素叠加可能相互放大影响,有些则可能相互抑制,宏观指标只是这众多影响的结果,内部的影响机制是黑箱。极端点说,不可能将每个因素的影响都分离出来。
那么怎么办呢?怎样能衡量具体某个运营动作带来的影响呢?答案就是实验,也只有实验。就是通常所讲的AB测试。实验中,运营动作施予对象必须分为实验组和对照组,实验组和对照组唯一的不同,就是实验组被施予了运营动作,而对照组没有。只有这样,观察实验组与对照组的指标差异(方差分析或者DID),我们才有可能去量化某个运营动作的影响。
数据不能替代逻辑推理

  1. 描述新增的时间范围

基于对照实验的组间比较

由于基于时间序列的组内比较会受到外界因素的干扰,所有有条件的话,需要设计对照实验来进行比较,也是我们熟知的AB测试。在AB测试中,我们要设置实验组和对照组,实验组施加实验刺激,比如使用新产品方案,对照组保持原样,比较实验组和对照组的产品指标,这样就可以评价产品方案是否有效

在设置实验组和対照组之前,需要满足几个条件:

  1. 两组实验样本特征相似,可比较
  2. 实验组和对照组之间只存在唯一的实验刺激导致的差异

你觉得,通过数据库中的记录,你能够充分了解你的业务吗?答案是否定的。说白了,数据库只是记录了发生在业务链条上的行为,但行为的结果并不代表业务的全部。举个例子,通过用户的使用行为数据,我们就能知道用户的体验吗?答案是不能,我们只是根据用户的“行为结果”去猜测他使用体验的好坏。真正的用户感觉,在他们的心理,许多时候,不会通过既定的使用路径和产品功能提现出来。
那么,数据库不能记录的信息,怎么获取呢?答案其实很简单,通过外部手段,创造条件去获取。概括为“调查”和“实验”两个词。比如用户体验不能量化的问题,直接问不就好了?调查分为访谈和问卷调查两个方式,每种方式都需要落地成可量化的结果。问卷调查建议规律性地长期进行,连续收集的数据在时间维度上可比,价值远远大于单次的问卷调查。实验的方式在第四章中有所论述,它正是一种创造数据的手段。通过实验组和对照组,创造出一个对比的条件,进而量化出差异,最终形成可靠的判断。
不可能分离多重因素影响

  1. 累计卸载率

产品数据分析的三板斧分别是:趋势分析、对比分析和细分分析。

文/胡晨川,微信公众号:川术
随着数据积累得越来越多,数据获取成本不断降低,人们开始走向另一个危险的极端,那就是任何事情都要看数据,任何决定都去依赖数据。这种风气培养出了越来越多的“数据呆”。作为一个数据分析师,我是非常反对“唯数据论”的。为什么呢?让我详细地来说一说。

新增顾名思义,指的是:没有使用过示例App的用户。

产品经理工作中离不开数据分析,特别是在这个流量越来越贵的时代背景下,每一份流量都值得珍惜,所以如何做好流量分析,最大程度的发挥每一份流量的价值,是摆在每一个产品经理面前的问题。

duncan02.jpeg

废话不多说,我们开始吧!

这里介绍三种产品数据分析的方法,乘坐产品数据分析三板斧。虽然这些方法在工作中都用过,但是没有总结成方法论。有了方法论的产品经理就像诸葛亮舌战群儒时自带提词器,如虎添翼。

宏观指标通常出现在数据面板(Dashboard)中,用于日常数据的监测,来判断产品的异常与否。

细分分析

细分分析就是维度和指标之间的相互结合,这里有两个概念:维度和指标

  1. 指标:指标是用来记录用户行为的数据,可以分为基本指标和复合指标,比如活跃用户数量,用户访问量是基本指标,比如功能点击率、用户留存这些需要基本指标简单计算得来的未复合指标

  2. 维度:维度是观察用户行为的角度。常用的分析维度包括:时间、功能、流量来源、地理、内容等

细分分析就是指标和维度的结合,同一指标在不同的维度下回显示出不同的属性。例如我们在分析用户新安装量上升的原因时,我们会将用户新安装量分流量来源进行分析,这样我们就会观察到不同流量渠道的新安装量,从而找到增长量来自于那个渠道。

其中核心指标主要分为两类:宏观指标与微观/功能指标。

基于时间序列的组内比较

这种方法类似于趋势分析的对比,分析一段时间中,时间前和时间后产品指标的变化。比如本周发布的版本做了功能开启率的优化,在评价产品优化是否有效时,我们可以比较发版前和发版后功能功能开启率是否提高了。不过基于时间序列的比较测试会受到很多因素的干扰,比如上面的例子,实验会受到产品新安装用户质量以及产品留存的影响。

这里介绍一种统计学方法解决解决这一问题:方卡检验和T检验。具体方法和原理请参见

卡方检验
T检验

这里要更加精确一些:『每日新增』才是衡量运营同学工作非常的核心指标。

同比环比监控法

以下是某电子商务网站的订单量数据,订单量有明显的周期性波动,周末数值要比周中高出不少,用户喜欢在这个网站进行消费,同时订单量保持一个增长的趋势。

图片 1

因为订单量保持增长,从周同比增长来看大概是在8%左右。从上图中标上颜色的数据中,我们可以观察到周一和周六的环比增长都高出平均水平,但是同比增长率保持在平均水平,是因为周一环比周六的数据会有较大下降,周六环比周五的数据会有较大提升,所以不是异常。其实只要观察就能发现异常,即同比和环比增长率两个同时被标上颜色,而第一周的周三和第二周的周二是由于第一周的周二的数据异常引发的后续反应。

举个例子,『员工甲』在自己的『A公司』办理了离职手续,几个月后又重新入职,那么对于A公司来说,员工甲算不算是公司新人呢?

当然,上述文字只是说了最一般的情况。其实最终对于新增单位的定义还要看具体数据统计平台自己的定义,至于关于数据统计平台的阐述,这就是后话了。

因为文章篇幅限制,本篇文章只会介绍前两个指标:『新增』『卸载』,剩余的部分会在接下来的文章里面进行阐述。

数据统计平台也是通过为用户分配唯一编号的形式进行确认的,目前常见的方式有三种:社会属性账号,例如:手机号码,微信号,邮箱……设备标识,例如:每个手机都有一个唯一的id,可以通过手机id来区分。应用标识,其实每个应用也有唯一的一个id,这也可以用于区分不同的用户。

题图来自 Unsplash,基于CC0协议。

对于第三个问题,用户卸载了App又进行了重装,那么这个用户还算不算新增用户?

  1. 新增究竟是什么

对于产品统计平台来说,也是如此。

关于卸载曲线,纯粹用文字解释可能比较麻烦,所以先给大家看一个示例图:

因为很多时候,我们不仅仅要看某一刻的卸载率,还要观测一段时间内,示例App的卸载率的变化,所以通常情况下,我们更多的是查看「长期卸载率」。

长期卸载率指的是:在一段时间内,每天前XX分钟/小时的卸载率的集合,如下图所示:

这张图展示的就是:示例App的卸载曲线。横轴代表着:距离首次打开事件的时间间距;纵轴代表着:某一时刻的卸载率。

通过这些指标就能很直观的判断:产品整体表现的好与坏,局部改动的得与失。

传统行业中的新增用户很好定义——就是个体的人。例如:某个餐馆开张,第一天来了100个顾客,那么这一天的新增用户就是100人。

宏观指标会从:新增、卸载、留存、活跃,四个维度来进行介绍,当然每个维度又有具体的细分。

虽然种类不多,但深究起来,也足以值得细细品味,不再多说,下期见!

其实单纯的看卸载率所获取的信息是远远不够的。

  1. 长期卸载率

所谓的核心指标指的是:能够衡量产品状态的数据标准。

但是,如果一个人有两个不同的身份证号,其实从国家的角度来看,就是完全独立的两个人。

累计卸载率既能体现出卸载的过程,又能直观的看到每个时间节点的累计卸载率。

所以,我们一般情况下定义的新增用户,指的是:安装并且打开过示例App的用户。

当然了,能不能把两张图结合在一起来看呢?

四、卸载

更确切的说:如果App从被打开到使用了1个小时的过程中,实验组的卸载率要远高于对照组。但是1个小时之后,对照组的卸载率才开始反超实验组。

  1. 新增的关键事件

这篇比较详细的说明了『统计单位』『宏观指标』『新增』『卸载』的概念。

上面两条曲线分别代表:对照组与实验组在15天的时间里,前24小时的卸载率的变化曲线。

对于这些文章,我心里有一个小目标:让一个毫无基础的人,看了这几篇文章也能对产品的数据分析有一个初步的了解。

这说明:实验组确实要比对照组好很多,那么可以进一步证明A功能确实不受用户的待见。

接下来所有的数据指标都来源于『示例App』。

接着上面的案例说:员工甲在A公司努力工作,职位升了,对于新到的部分来说,可能算是新面孔,但是对于公司来讲,肯定不算是新员工了。

但是,卸载这个指标非常的难以统计到,以至于市面上主流的统计平台只有Google的Firebase统计平台才能获取。但是,国内的互联网环境你们也懂,很多国内的Android系统内置的Google服务被阉割了。所以,主要面向国内市场的互联网公司根本就拿不到。

而某段时间内卸载率的变化趋势/斜率,则代表着:这段时间内用户的卸载速度。

一直想把产品工作中遇到的数据分析问题做一个系统的总结,但因为种种原因一直没有下笔。前些天详细梳理了一番,打算通过几篇文章将产品工作中的“数据分析”说清楚,文章尽量用通俗易懂的言语阐述。

一般情况下,还是默认为:只有发生了首次打开的事件才会被认为是有效新增。因为只有用户打开了示例App,才能体验示例App的提供的服务,同样只是安装但是一直没有打开,那基本上等同于无效安装。

某一批的新增用户中,截止到某一时刻,卸载用户占据新增用户的比例。举个例子:如果今天的新增用户有100人,这100个人中,有30人在首次打开示例App后的24小时内,把示例App卸载了。那么可以定义:今天示例App的24小时卸载率为40% 。

  1. 卸载率

但是对于手机App来说,这个维度就显得有些粗了,举个几个例子:用户甲有两个手机,并且都安装了示例App,那么对于示例App究竟甲算究竟作一个用户还是算作两个用户呢?如果在示例App能够在一台手机上进行重复安装,用户甲在自己的手机上安装了两个示例App,那么又该怎么算呢?如果一个用户甲第一天安装了示例App,然后第二天进行了卸载,第三天又重新安装了,那在第三天的时候,甲算不算新增用户呢?如果用户甲第一天安装了示例App,然后在第二天进行了升级/更新,那甲算不算新增用户呢?

继续以员工甲与A公司为例:如果员工甲在A公司只是提交了入职材料,但是一直没有来公司上班。那么,对于A公司来说,员工甲基本上算是无效员工,只有员工甲为A公司真正工作了、服务了,这样的员工才算是一个合格的员工。

给人最直观的感受是:实验组的卸载率显著低于对照组。

图片 2

首先卸载是衡量一个产品好与坏非常直观的指标,所以非常的有意义;

最开始提到过:新增是衡量运营同学工作的核心指标之一。

通过数据可以看出:砍掉功能A后,卸载率降低了,但是我们真的能斩钉截铁的说用户不喜欢功能A吗?

如果笼统的说新增这个指标,上面那段文字的描述就已经足够了,但是如果你想细致的了解,那可以从以下几个维度进行细分:

对于最后一个问题:升级的用户,对于新版本来说算不算是新用户?

当然最长用的还是每日新增。

如下图所示:

二、统计的基本单位

卸载指标从时间连续性上可以分为两个类型:『卸载率』与『卸载曲线』。

或许『累计卸载率』能满足这样的要求。

如果按照时间范围这个维度来划分新增用户,一般可以分为『单位时间新增』与『累计新增』。

宏观指标主要衡量产品的整体状况,而微观指标则能够精准的呈现产品中某些功能的使用情况。

在明确了用户数量的『基本单位』后,我们正式进入产品数据核心指标的阐述部分。

卸载率指的是:截止到某一时刻,某批新增用户中,卸载用户的占比。

图片 3

从卸载曲线的示意图中,我们可以明显的看出:实验组的卸载峰值高度明显低于对照组,而且峰值时间也要比对照组晚一些。

为了方便,我们先凭空造出一个App,名为:示例App。

虽然结论很容易得出,但是真的就这样结束了吗?

所以关于卸载仍然要说上几句。

现在我们可以给卸载曲线下一个定义:指的是在指定的时间段内,每个时刻的卸载用户数占新增用户数的比例的集合。

这里补充一点:接下来所有的案例均以应用id作为基本单位进行阐述。

这里有两个关键的操作:安装与首次打开。

在正式介绍数据指标之前,我们要明确一个概念:用户数量统计的基本单位。

图片 4

  1. 卸载曲线

但是,抱着内心中仅存的一丝幻想:万一将来Google又回来了呢?

回顾一下国家是怎么统计人口的:是为每个人分配唯一的一个身份编号,这个编号不仅仅保存在户口本与身份证上,还保留在国家的统计局里。

再次重申一下『卸载率』的定义:

至于累计新增这个指标,可能对外提到的会多一些,例如:全中国一共有XXX用户用过我们的软件这样的描述,无论对于吸引投资还是展示公司的形象,都是挺管用的。

所以,这个时候只盯着固定时刻的卸载率,很容易导致我们的误判。如果这个时候能够结合着『卸载曲线』去分析,就会避免这样的问题。

这意味着在设计产品的时候,要尽量让用户在刚打开App的时候,就能看到该App的特色/优势。如果将这些功能藏着掖着,待用户自己发掘,结果很有可能是这些功能根本没有展示的机会,就胎死腹中!

如果从职责划分的角度,新增指标更多的属于运营指标。因为产品功能上的改动,往往对新增数据的影响不大。新用户的获取属于流量获取行为,更多的的归因于宣传活动、广告投放、产品ASO的优化等。

单位时间新增又可以分为:每日新增、每周新增、每月新增、每季……

一、宏观指标

累计卸载率指的是:在指定的时间段内(一般时间范围为1天),单位时刻的累计卸载率。

发生了什么行为的用户算作是新增用户呢?

从图中我们可以看到:无论是实验组,还是对照组,其卸载曲线在前几分钟内急剧的上升,然后有急剧的回落,最终逐渐的平稳,直至趋向于一条直线。

定义完了新增的基本单位,接下来要说新增的触发时机了。

试想这样一个场景:实验组和对照组唯一的区别就是实验组砍掉了A功能。

一直再考虑要不要加上『卸载』这么一个指标,纠结的原因主要在于:

而卸载曲线则是:卸载率在时间这个维度上的动态变化。

图片 5

如果是因为功能A的存在,导致了用户安装1小时之后会有极大的概率出现严重的bug,而用户实际上非常喜欢功能A,只是因为忍受不了这个bug而被迫进行卸载,那么这个时候仅仅通过长期卸载率是无法归结出正确的原因的。

不同的应用对于用户单位的定义也不尽相同:对于拥有账号体系的应用,一个用户特指注册的账号,但是对于没有账号体系的应用,多数使用的是应用id作为用户数量的基本单位,而设备id通常作为补充。

每个节点代表着截止到某一时刻为止,总的卸载率。

这里给出的答案:依然是新增用户。

三、新增

一般来讲,应该不算是新用户的。

所以,很容易得出结论:实验组要好于对照组。

本文由 @MAGICY 原创发布于人人都是产品经理。未经许可,禁止转载。

如果这用户开始使用了,那么该用户便是示例App的一个新增用户。

五、结语

本文由广东快乐10分预测发布于广东快乐10分预测,转载请注明出处:出品数据分析的三板斧

关键词: 数据分析 简介 怎么看 指标