ZKX's LAB

相对数值在数据分析中的运用

2020-11-24新闻17

编辑导语:在进行数据对比时,我们会用到相对数值的概念,相对数值可以明确我们在不同对象之间的关系;所以在数据分析中,我们经常会用到相对数值;本文作者分享了关于相对数值在数据分析中的运用,我们一起来看一下。

双十一已经结束很久了,店铺A的运营同学查看了店铺今年11月1日的销售额和去年11月1日的销售额数据后做了一个简单的数据简报,2020年11月1日销售额325,620元,2019年11月1日销售额168,768元,2020年11月1日销售数据相较于19年提升了108%。

在这份运营同学的数据简报中就暗含有绝对和相对的概念:绝对,指存在的某种绝对事实,是客观存在的;在这份简报中,销售额数据就是一个既定的事实,不会随着其余条件的改变而改变,这两个销售额数值是绝对的。相对,指一个整体和另一整体或者一定条件比较后的结果,是存在变化的,在这份简报中20年的数据对比19年的数据,得到提升108%这个数值,就是相对的。

从这里,我们可以发现,“绝对数值”代表了某种客观事实,但仅有客观事实,是无法对这个事实进行分析的;如果这份简报中,只有19年和20年的销售数据,我们只能分别对2年的销售数据有一个量的概念;但无法判断这两年的关系,而引入“相对”的数值后就能帮我们解决这个问题,通过对这两年11月1日数据的对比,我们得出了20年较19年销售数据有非常大的提升。

“相对数值”可以帮助我们明确不同对象之间的关系,由此可见,相对数值在数据分析中有非常重要的意义,本文就想讨论相对数值在数据分析中的运用。

一、什么是相对数值1. 定义

相对数值的定义,是指A相对于B后得到的数值,其中A是目标值,B是对比值。

目标值:想要了解的对象的数据值。在运营简报中我们想了解今年11月1日的销售数据情况,今年11月1日的销售额数据就是一个目标值。

对比值:为了解“目标值”而增设的辅助数据,可以是一个具体数值,也可以是一个范围规则;在运营简报中,为了衡量今年11月1日销售数据,而纳入的“2019年11月1日销售数据”就是一个对比值。

从定义中可以得出“相对数值”需要满足两个条件:相对数值是由绝对数值计算而来的,绝对数值是相对数值的基础且对绝对数值在数量上是有一定的要求;需要存在目标值和对比值。

通过一组数据来加深对“相对数值”定义的理解吧,2020第3季度国内GDP初步核算数据为266,172亿元,其中第三产业142,595亿元,占比53.57%,这个占比数据就是相对数值,它是目标值“第三产业GDP”除以对比值“Q3国内GDP”得到的1个数据,满足了定义相对数值的两个条件。

2. 和绝对数值的关系

绝对数值是相对数值的基础,相对数据是由绝对数据通过一定的计算得到的,最常见的一种计算方式就是:相对数值 = 目标值 / 对比值。

绝对数值用来描述一个对象的具体量,而相对数值可以描述一个对象的具体量相较于对比值的关系。

将绝对数值通过计算转换成相对数值,是一个让本来互相独立的客观事实产生关联的过程,可以形成包括占比多少、排名高低、差异大小等关系,让用户对目标对象的量有一个认知。

比如在上文GDP那组数据中,仅看第三产业142,595亿元这个值,我们只能从这个绝对数值上得到“第三产业的GDP的量有这么多”的感知,但是对“GDP量到底是多还是少”的判断是无法形成的。

引入相对数值占比后,53.57%这个数值不仅反应了第三产业GDP相较于国内GDP的占比情况,也能帮助我们形成GDP多少的判断,可以认为第三产业占比都超出了50%;那么整个的量是比较大的,对整体Q3GDP的贡献也比较多。

二、常见的相对数值以及运用

了解了相对数值的定义之后,我们可以通过不同的用途将相对数值划分为常见的几种类型,包括占比相对数、比较相对数、排名相对数。

1. 占比相对数

占比相对数是相对数值的一种类型,通过个体和总体的数据对比,可以表达总体和个体的关系,反应总体的构成情况,为我们分析总体提供了数据依据:目标值 = 个体数值对比值 = 总体数值相对数值 = 目标值 / 对比值 = 个体数值 / 总体数值

例如上文中第三产业GDP和总GDP就是一个包含的关系,第三产业GDP是个体,总GDP是总体,53.57%这个占比相对数,就可以表达第三产业占整个经济的比重,说明了社会经济现代化程度高。

占比相对数除了可以用来描述总统和个体的关系,还可以来描述个体的完成进度,也可以用于异常情况的预警。

案例:

双十一快到了,预售期间,某客服团队为了维护客户关系,要求客服组A中的每1个客服同学需要完成“对分配的老用户名单定向发送关怀短信”的任务。

截止10月31日统计到了组内5个客服具体的发送情况如下:

只看这个表格的话,仅能了解客服同学被要求的目标,以及具体已发送的量,但是具体的发送情况没有办法衡量,也无法看出发送的完成情况。

这个时候我们引入“相对数值”——”完成占比”就能解决这个问题,完成占比 = 已发送人数 /目标发送人数。

再来看下加入该字段后的表格:

分析“加入完成占比”后的表格,就可以分析出每个客服的一个完成情况,像是客服A的完成度就较差,只对4成不到的老客户发送了维系短信;而客服E的完成情况就比较好,完成了9成以上的老客户维护——这就是相对数值“比例”来描述完成度的一次应用。

那么为什么说“比例”还可以应用于发现异常的场景内呢?

假设我们看到客服H的完成比是103%,我们会产生什么想法,理论上来说分配的名单人数是大于等于已经发送的人数的,即使全部完成,比例也应该是100%,那么多出来的人数是什么情况呢?

对名单外的客户进行了关怀短信的发送,还是对名单内的客户进行了重复发送短信,这就是“相对数值”发现异常的应用;我们通过一个正常情况不太会可能出现的异常相对数值,来定位出现异常的对象或者环节。

2. 比较相对数

比较相对数,常通过两个对象之间的比较,来说明两者之间的相关性和发展状况。

想了解对象A相较于对象B的情况:目标值 = 对象A数值对比值 = 对象B数值相对数值 = 目标值 / 对比值 = 对象A数值 / 对象B数值

若想了解对象B相较于对象A的情况,就需要将上述公式反过来即可。

案例:

2019年天猫双十一全天交易额2684亿,假设今年2020年天猫双十一全天交易额为X亿,我们就可以通过“比较相对数”来衡量2020年天猫双十一相比于去年的一个增长情况。目标值:2020双11全天销售额X;对比值2019双11全天销售额2684;增长情况:比较相对数 Z = X / 2684;如果Z>1,那么可以说2020年的天猫双十一相比于去年呈增长状态;如果Z=1,那么可以说与去年呈持平;如果Z<1,就是衰退了;

这就是通过“比较相对数”来帮助我们了解今年双11相较于19年的一个发展情况,解决了只掌握两个双11销售数据无法了解两者的相关性的问题。

3. 排名相对数

排名相对数的运用常发生在这样的场景下,受到条件的制约,不同的对象值无法直接进行比较;就可以通过排名相对数将对象的差异值抽象化,来使得不同的对象之间可以进行比较。

想了解对象A和对象B的对比情况:目标值 = 对象A数值;目标值 = 对象B数值对比值 = 一定的标准相对数值1 = 对象A数值 / 一定的标准相对数值2 = 对象B数值 / 一定的标准

对象A和对象B本身无法直接进行比较,但是通过“排名相对数”转化成“相对数值1”和“相对数值”2后就能进行对比,从而了解两个对象之间的差异情况了。

案例:

双十一过后,客服团队需要考核售后客服的一个接待能力,掌握到两个售后客服在双11当天的数据如下:客服A:接待人数100人,平均响应时间2.7s,未回复5人客服B:接待人数300人,平均响应时间5.6s,未回复10人

因为客服A和客服B的接待人数不同,无法简单的通过“比较相对数”来描述2者之间的接待能力差异。

为此我们需要引入“排名相对数”,首先需要假设一定的标准:接待人数分为3档,0-150人计1分,151-300人计2分,300人以上计3分平均响应时间分为3档,15s以上计1分,5-15s计2分,0-5s计3分未回复分为3档,大于7人计1分,7-5人计2分,0-4人计1分客服接待能力考评 = 30%接待人数评分+40%平均响应时间评分+30%未回复人数评分

将客服A和客服B数据代入:

客服A:接待人数:1分;平均响应时间:3分;未回复:2分客服接待能力考评:30% * 1 + 40% * 3 + 30% *2 = 0.3 + 1.2 + 0.6 =2.1

客服B:接待人数:3分;平均响应时间:2分;未回复:1分客服接待能力考评:30% * 3 + 40% * 2 + 30% *1 = 0.9 + 0.8 + 0.3 =2

客服A接待能力考评>客服B接待能力考评

通过“排名相对数”就可以看出客服A能接待能力大于客服B。

三、总结

相对数值,是由目标值和对比值通过对比后得到的数值,其中对比值可以是某一个具体对象的绝对数值,也可以是某一个标准范围。

通过不同的用途划分了占比相对数,比较相对数和排名相对数,帮助用户在不同场景下了解对象之间的关系,为后续的运营提供了数据支持。

本文由 @晌午 原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自 Unsplash,基于CC0协议

#技术编程

随机阅读

qrcode
访问手机版