登录
首页 >  数据库 >  MySQL

统计科学之捋一捋PDF、PMF、CDF是什么

来源:SegmentFault

时间:2023-01-24 20:26:55 108浏览 收藏

编程并不是一个机械性的工作,而是需要有思考,有创新的工作,语法是固定的,但解决问题的思路则是依靠人的思维,这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《统计科学之捋一捋PDF、PMF、CDF是什么》,文章讲解的知识点主要包括MySQL、数据库、python、网页爬虫、机器学习,如果你对数据库方面的知识点感兴趣,就不要错过golang学习网,在这可以对大家的知识积累有所帮助,助力开发能力的提升。

还记得前段时间看过一篇文章,就是调查大家疫情期间都干了什么,有一条是疫情期间终于弄清楚了PDF和CDF的区别。PDF、PMF、CDF这几个概念确实很容易混淆。今天就来捋一捋这几个概念。

1.基本概念

PDF:是英文单词 probability density function 的缩写,翻译过来是指概率密度函数,是用来描述连续型随机变量的输出值,在某个确定的取值点附近的可能性的大小的函数。

PMF : 是英文单词 probability mass function 的缩写, 翻译过来是指概率质量函数,是用来描述离散型随机变量在各特定取值上的概率。

CDF : 是英文单词 cumulative distribution function 的缩写,翻译过来是指累积分布函数,又叫分布函数,是概率密度函数的积分,用来表示离散型随机变量x的概率分布。

总结一下就是上面三者的横轴都是随机变量x的取值,PDF的纵轴表示连续型随机变量x出现的可能性(非概率),PMF的纵轴表示离散型随机变量x出现的概率,CDF的纵轴表示连续型随机变量x的概率。

相信大家看完上面的概念以后对这几个还是有点懵,接下来我们就仔细讲讲这些概念的来龙去脉。

2.频率分布条形图

频率分布条形图主要用在离散数据中,横轴为一个个具体的点(类别),纵轴为这些点对应的频率。

image

当试验次数足够多时,我们可以用频率来代替概率,也就是可以把频率分布条形图中的纵轴当作每个类别出现的概率值。此时的频率分布条形图就可以当作是PMF图。

3.频率分布直方图

在频率分布直方图中横轴表示众多个连续变量离散化以后的区间,这个区间的大小称为组距,纵轴表示频率/组距。

image

上图中每个长方形的面积就是该区间的频率,即概率。

当长方形的宽度无限小,即组距无限小的时候,频率分布直方图就无限接近于下方这样的光滑曲线,我们把这条曲线叫做概率密度曲线,即PDF。

image

4.累积分布函数

累计分布函数就是从上图中的概率密度曲线的最左边开始,然后逐渐往右求取曲线下方的面积,即概率。

到这里,我们也就讲完了《统计科学之捋一捋PDF、PMF、CDF是什么》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于mysql的知识点!

声明:本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>
评论列表