网页爬虫
已收录文章:29篇
-
今天这篇聊聊统计学里面的置信度和置信区间。1.点估计在讲置信度和置信区间之前先讲讲点估计,那什么是点估计呢?给你举两个例子你就知道了。现在你想要知道一个学校学生的身高情况,497 收藏
-
今天给大家分享一种在数据分析过程中关于率指标分析可能会犯的一种错误。这个问题其实很多新人都会犯,有的老人也会犯,而且很多时候错了以后并不自知。刚好读者群有人在问类似的问题492 收藏
-
我们前面讲过方差分析,方差分析的应用场景是什么样子的呢?不记得同学可以翻回去看看。当我们要比较两组或者多组均值有没有显著性差异的时候,我们可以用方差分析。请注意,这里面我434 收藏
-
前面讲了大数定理,讲了中心极限定理,有读者留言让讲讲切比雪夫定理,安排。这一篇就来讲讲切比雪夫定理。在讲切比雪夫定理之前,我们先看下切比雪夫不等式:其中P表示概率,X是随机424 收藏
-
今天我们来聊聊什么是OC曲线,OC曲线是用来反映:一个批次的产品被接收的概率与该批次产品不合格率之间的关系。如下图这样的曲线:横轴是该批次的整体不良率(不合格率),纵轴是在该不合402 收藏
-
最近闲着,把之前写的小爬虫分享一下,才疏学浅,仅当参考。 [介绍文档] git clone git@github.com:caffreycc/jb51.com_crawler.git 或者直接到https://github.com/caffreycc/jb51.com_crawler.git 下载zip文件 pip install -r re402 收藏
-
1.回归模型简介我们先来看一下什么是回归模型,以下解释来源于百度百科:回归模型是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于397 收藏
-
这一篇我们讲讲统计中的最小样本量计算。大家先想想为什么叫最小样本量,而不是最大或者直接叫样本量计算呢?这是因为最小样本量这个概念主要用在抽样统计中,抽样统计为了研究某一事387 收藏
-
今天我们来聊聊统计学中的偏态分布,聊偏态分布以前我们先看看正态分布,下面这张图在公众号文章中多次出现,就是传说中的正态分布。这张图中的横轴是随机变量 x 的具体值,正态分布的382 收藏
-
前面我们讲过中心极限定理。这一节来讲讲大数定理,大数定理和中心极限定理是比较接近的两个概念,这两个定理经常一起出现。我们来具体看下大数定理的内容:大数定律是指:随着样本容376 收藏
-
之前我们讲过T检验、F检验,这一篇,我们讲讲Q检验。Q检验又称舍弃商法,主要是用来对可疑值(异常值)进行取舍判断的。比如现在做了若干次实验,然后得到了若干个观测值:10.14、10.12、10.25371 收藏
-
我们前面讲了异方差,也讲了怎么用图示法来判断是否有异方差,这一篇来讲讲怎么用统计的方法来判断有没有异方差。关于检验异方差的统计方法有很多,我们这一节只讲比较普遍且比较常用365 收藏