登录
首页 >  数据库 >  MySQL

统计科学之一种常见的关于率指标的错误分析思路

来源:SegmentFault

时间:2023-02-16 15:41:13 492浏览 收藏

你在学习数据库相关的知识吗?本文《统计科学之一种常见的关于率指标的错误分析思路》,主要介绍的内容就涉及到MySQL、python、网页爬虫、数据挖掘、深度学习,如果你想提升自己的开发能力,就不要错过这篇文章,大家要知道编程理论基础和实战操作都是不可或缺的哦!

今天给大家分享一种在数据分析过程中关于率指标分析可能会犯的一种错误。这个问题其实很多新人都会犯,有的老人也会犯,而且很多时候错了以后并不自知。刚好读者群有人在问类似的问题,所以就来写篇文章分享下。

先看个例子,如下展示了XXX公司各个渠道的留存率情况,现在如果想要看一下该公司总计的留存率情况应该怎么算呢?

image

直观看上去应该有两种算法,第一种算法是用各个渠道所有的留存用户数÷各个渠道所有的新注册用户数,第二种算法是直接对三个渠道的留存率求一个平均值。那么这两种算法有啥区别呢?算出来的结果有啥不一样呢?如果你把上表中的数字用两种算法算一下,算出来的结果是不一样的。那到底哪种是正确的呢?

如果你平常是用的第一种算法,那么恭喜你,你的做法是对的,但是第二种算法错在哪里了呢?这是因为不同渠道的新注册用户数是不一样的,所以对最后结果的影响程度也是不一样的,如果你直接对三个渠道的留存率求平均值,也就是你假设了这三个渠道最后对总留存率的影响是一样的,但显然是不一样的。所以这里面引出了第三种算法,即:

image

试着动手算一算,用第三种算法算出来的结果和第一种算法算出来的结果是一样的。

那如果不同渠道的新注册用户数是一样的情况下时,比如下表这样,这个时候用上面三种不同的算法算出来的结果都会是一样的。

image

以上就是《统计科学之一种常见的关于率指标的错误分析思路》的详细内容,更多关于mysql的资料请关注golang学习网公众号!

声明:本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>