网页爬虫
已收录文章:29篇
-
还记得前段时间看过一篇文章,就是调查大家疫情期间都干了什么,有一条是疫情期间终于弄清楚了PDF和CDF的区别。PDF、PMF、CDF这几个概念确实很容易混淆。今天就来捋一捋这几个概念。1.基本108 收藏
-
上次写了统计学里面的置信度与置信区间以后,文章反响还不错,这次再来试着写写统计学里面的假设检验。假设检验的核心其实就是反证法。反证法是数学中的一个概念,就是你要证明一个结145 收藏
-
1.回归模型简介我们先来看一下什么是回归模型,以下解释来源于百度百科:回归模型是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于397 收藏
-
今天我们来讲一下异方差,在异方差以前,我们先讲一下与异方差类似另一个概念:同方差,那同方差又是什么呢?同方差 = 相同 + 方差,顾名思义就是方差相同。那方差又是什么呢?方差是用219 收藏
-
上一篇讲了假设检验,这一篇讲讲方差分析。1.背景:假如你们现在针对用户提出了三种提高客单价的策略A、B、C,现在想看一下这三种策略最后对提高客单价的效果有什么不同,那我们怎么才215 收藏
-
最近闲着,把之前写的小爬虫分享一下,才疏学浅,仅当参考。 [介绍文档] git clone git@github.com:caffreycc/jb51.com_crawler.git 或者直接到https://github.com/caffreycc/jb51.com_crawler.git 下载zip文件 pip install -r re402 收藏
-
今天这篇来讲讲加权最小二乘法(WLS),加权最小二乘是在普通的最小二乘回归(OLS)的基础上进行改造的,主要是用来解决异方差问题的。OLS的常规形式如下:我们在前面讲过OLS有几个基本假定,237 收藏
-
今天我们来聊聊统计学中的偏态分布,聊偏态分布以前我们先看看正态分布,下面这张图在公众号文章中多次出现,就是传说中的正态分布。这张图中的横轴是随机变量 x 的具体值,正态分布的382 收藏
-
01.前言前面我们讲了一元线性回归,没看过的可以先去看看:[一元线性回归分析]。这一篇我们来讲讲多元线性回归。一元线性回归就是自变量只有一个x,而多元线性回归就是自变量中有多个x279 收藏
-
今天给大家分享两个概念,比例和比率。前两天发过,发了以后有读者反映有点瑕疵,所以删除了重发。比例和比率,乍一看上去,好像这两个指标没啥区别,都是用来表示比的,但实际上两者221 收藏
-
1.前言我们在方差分析里面有讲过,方差分析有一个很重要的前提就是叫方差齐性。这一篇来讲讲如何来检验方差齐性。先讲讲什么是方差齐性,方差齐性是指不同组间的总体方差是一样的。那314 收藏
-
前面讲了大数定理,讲了中心极限定理,有读者留言让讲讲切比雪夫定理,安排。这一篇就来讲讲切比雪夫定理。在讲切比雪夫定理之前,我们先看下切比雪夫不等式:其中P表示概率,X是随机424 收藏