数据挖掘
已收录文章:27篇
-
现在很多企业都喜欢在互联网进行线上推广,因为光进行线下拓客所获得的客源是极其有限的,所以进行线上拓客就有机会获得线上海量的潜在客户。线上推广的方式有很多种,如网站,网页推289 收藏
-
我们在前面的方差分析中有提过一个概念就是自由度,在前面文章中给了一个计算就是自由度=样本数-1。这一篇就来具体聊聊什么是自由度。先来看看百度百科的解释:自由度(degree of freedom, df)284 收藏
-
三月中旬,Spark发布了最新的1.3.0版本,其中最重要的变化,便是DataFrame这个API的推出。DataFrame让Spark具备了处理大规模结构化数据的能力,在比原有的RDD转化方式易用的前提下,计算性能更还快278 收藏
-
上一篇文章我们介绍的时间预测的方法基本都是通过历史数据直接求平均算出来的的。这一篇讲一些用模型来预测的方法。1.AR(p)模型先讲第一个AR模型,AR的全称是Auto Regression,表示自回归,大259 收藏
-
作者:刘腾飞 汇量后端开发工程师阿里云开源OLAP研发团队EMR-StarRocks介绍阿里云EMR在年初推出了StarRocks服务,StarRocks是新一代极速全场景MPP(Massively Parallel Processing)数据仓库,致力于构建极速240 收藏
-
今天这篇来讲讲加权最小二乘法(WLS),加权最小二乘是在普通的最小二乘回归(OLS)的基础上进行改造的,主要是用来解决异方差问题的。OLS的常规形式如下:我们在前面讲过OLS有几个基本假定,237 收藏
-
学过统计学的同学应该对置信区间都有了解,置信区间又叫估计区间,是从概率来讲某个随机变量可能取的值的范围。在前面的文章[聊聊置信度与置信区间]中讲过为什么会有置信区间以及置信231 收藏
-
上一篇讲了假设检验,这一篇讲讲方差分析。1.背景:假如你们现在针对用户提出了三种提高客单价的策略A、B、C,现在想看一下这三种策略最后对提高客单价的效果有什么不同,那我们怎么才215 收藏
-
运营商大数据简介首先我们来了解一下运营商大数据,运营商即中国移动,中国联通,中国电信三大运营商。运营商大数据是指三大运营商的用户上网行为数据,用户通信行为数据,用户基本特204 收藏
-
当下,企业的实时计算需求越来越高频,很多企业和组织选择建设实时数据仓库,以敏捷支撑实时报表分析、智能算法推荐、系统风险预警等多元业务场景需求。相比离线数仓,实时数仓有哪些188 收藏
-
1 前言SQL进阶主要介绍谓词、CASE表达式、嵌套子查询、连接(以列为单位对表进行连接)和UNION运算(表为单位)。2 SQL进阶2.1 谓词LIKE介绍LIKE之前,先介绍通配符,MySQL只支持百分号(%)和下162 收藏
-
自 Apache Doris 1.1.0 版本发布距今已经有数月之久,在这一期间,我们重新思考并确立了社区新版本发布的流程,正式引入了 LTS (Long-Term Support,长周期支持)版本的概念,在 1.1.x 系列版本中不160 收藏