数据挖掘
已收录文章:27篇
-
三月中旬,Spark发布了最新的1.3.0版本,其中最重要的变化,便是DataFrame这个API的推出。DataFrame让Spark具备了处理大规模结构化数据的能力,在比原有的RDD转化方式易用的前提下,计算性能更还快278 收藏
-
之前我们讲过T检验、F检验,这一篇,我们讲讲Q检验。Q检验又称舍弃商法,主要是用来对可疑值(异常值)进行取舍判断的。比如现在做了若干次实验,然后得到了若干个观测值:10.14、10.12、10.25371 收藏
-
作者:刘腾飞 汇量后端开发工程师阿里云开源OLAP研发团队EMR-StarRocks介绍阿里云EMR在年初推出了StarRocks服务,StarRocks是新一代极速全场景MPP(Massively Parallel Processing)数据仓库,致力于构建极速240 收藏
-
当下大部分依赖电话销售,短信推广和广告投放为主体业务的企业,公司和销售人员,最关心和最感兴趣的当属精准的客户数据资源。每年都有企业,公司,销售人员花费大量的人力物力财力去120 收藏
-
现在是大数据时代,大数据助力和驱动着互联网行业和产业的变革,大数据分为很多种,其中以移动大数据,联通大数据为首的运营商大数据,其大数据的主要应用目的是:助力各行业,各企业387 收藏
-
现在很多企业都喜欢在互联网进行线上推广,因为光进行线下拓客所获得的客源是极其有限的,所以进行线上拓客就有机会获得线上海量的潜在客户。线上推广的方式有很多种,如网站,网页推289 收藏
-
运营商大数据简介首先我们来了解一下运营商大数据,运营商即中国移动,中国联通,中国电信三大运营商。运营商大数据是指三大运营商的用户上网行为数据,用户通信行为数据,用户基本特204 收藏
-
上一篇讲了假设检验,这一篇讲讲方差分析。1.背景:假如你们现在针对用户提出了三种提高客单价的策略A、B、C,现在想看一下这三种策略最后对提高客单价的效果有什么不同,那我们怎么才215 收藏
-
今天这篇来讲讲加权最小二乘法(WLS),加权最小二乘是在普通的最小二乘回归(OLS)的基础上进行改造的,主要是用来解决异方差问题的。OLS的常规形式如下:我们在前面讲过OLS有几个基本假定,237 收藏
-
1.前言我们在方差分析里面有讲过,方差分析有一个很重要的前提就是叫方差齐性。这一篇来讲讲如何来检验方差齐性。先讲讲什么是方差齐性,方差齐性是指不同组间的总体方差是一样的。那314 收藏
-
当下,企业的实时计算需求越来越高频,很多企业和组织选择建设实时数据仓库,以敏捷支撑实时报表分析、智能算法推荐、系统风险预警等多元业务场景需求。相比离线数仓,实时数仓有哪些188 收藏
-
前面讲了大数定理,讲了中心极限定理,有读者留言让讲讲切比雪夫定理,安排。这一篇就来讲讲切比雪夫定理。在讲切比雪夫定理之前,我们先看下切比雪夫不等式:其中P表示概率,X是随机424 收藏