首页 > 数据库 > MySQL

统计科学系列之聊聊置信度与置信区间

来源：SegmentFault

时间：2023-01-13 12:15:08 497浏览收藏

哈喽！今天心血来潮给大家带来了《统计科学系列之聊聊置信度与置信区间》，想必大家应该对数据库都不陌生吧，那么阅读本文就都不会很困难，以下内容主要涉及到MySQL、数据库、python、网页爬虫，若是你正在学习数据库，千万别错过这篇文章~希望能帮助到你！

今天这篇聊聊统计学里面的置信度和置信区间。

1.点估计

在讲置信度和置信区间之前先讲讲点估计，那什么是点估计呢？给你举两个例子你就知道了。

现在你想要知道一个学校学生的身高情况，你可以把所有的学生测量一遍，然后得到答案，这种方法可以，而且得到的数据肯定是最真实的，但是这里有一个问题，什么问题呢？就是如果学生人数太多，全部测量的话工作量太大了，那怎么办呢？那就随机挑选一部分学生，然后测量这一部分学生的身高，得到一个值(一般用平均值)，用这一部分的平均值来估计整体学生的身高情况，我们把这种估计方式称为

点估计

。

现在你要看一下某流水线上 iphone 手机的不合格率，怎么看呢？最笨的方法还是把所有的手机全部开机试用，统计不合格手机的占比，这样可以吗？很明显是不可以的。那怎么才能知道这一条流水线的质量，那就是抽样，抽取整条流水线上的部分手机进行检验，会得到一个合格率，然后用这个合格率去估计整条流水线的合格率，同样这种方式也是

点估计

。

那现在是不是大概理解点估计的意思了，就是用随机抽样的样本的计算出来的指标值去估计整体指标情况。常用的点估计方法有如下：

用样本均值估计总体均值
用样本方差估计总体方差
用样本的分位数估计总体分位数
用样本的中位数估计总体中位数

2.区间估计

以前上学的时候经常会考试，考完试以后老爱去估分，一般人估分不太可能直接估一个具体的数，肯定都是估一个大概的数，啥叫大概的数呢？就是比如高考分数预计 600 左右，这个左右其实就是一个区间，还有平常很多食品包装袋上会写 ±0.5 KG，表示啥意思呢？就是要么多给了你 0.5 KG，要么少给了你 0.5 KG。我们把这种用一个范围来对一个事情进行估计的方式称为区间估计，得出来的区间就是