按时间归档:2017年08月
-
直播 | 2017大数据开发三大生态系统全面深入学习,免费试听(已有470多人报名)
《数据科学与大数据技术训练营》大数据开发系列-免费试听课 课程介绍: 课程内容:学习大数据主要的三大生态系统NoSQL(MongoDB)、Spark和Hadoop的历史及目前发展的…
-
如何用 Python 执行常见的 Excel 和 SQL 任务
摘要:数据从业者有许多工具可用于分割数据。有些人使用 Excel,有些人使用SQL,有些人使用Python。对于某些任务,使用 Python 的优点是显而易见的。以更快的速度处理更…
-
《大数据分析与挖掘综合能力实战》内训课程顺利举行
8月19日下午,深圳某运营商大数据中心《大数据分析与挖掘综合能力实战》内训课程在深圳福田区举行,本次课程由PPV课承办,为期三天。本课程为大数据分析实战课程,内容由浅入深,从数据统…
-
浅谈C5.0与CART算法的比较–理论理解
一、决策树的发展 决策树是目前比较流行的一种分类算法,实质上是一种自上而下的归纳学习算法。该算法最早由Quinlan在1986年提出,当时称为ID3算法,该算法是基于信息增益进行节…
-
《数据科学与大数据技术》训练营-数据分析&数据挖掘方向-初级-上海班
课程背景 2016年2月,教育部公布新增“数据科学与大数据技术”本科专业(专业代码080910T),首批北京大学、对外经济贸易大学和中南大学获批,第二批有32所高校成功申请。 《数…
-
横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow
分布式机器学习是机器学习领域的一大主要研究方向。近日纽约州立大学布法罗分校计算机科学与工程教授、Petuum Inc. 顾问 Murat Demirbas 和他的两位学生一起发表了…
-
入门 | 解读分类算法与聚类算法
学习数据挖掘的朋友,对分类算法和聚类算法都很熟悉。无论是分类算法还是聚类算法,都有许多具体的算法来实现具体的数据分析需求。很多时候,我们难以判断选择分类或者聚类的场合是什么。我们最…
-
R包之tm:文本挖掘包
简介 安装 数据输入—文集(corpus) 数据输出 查看语料库(corpora) 查看某几条信息 查看单个文档元数据 查看单个文档内容 查看多个文档内容 变换(transform…
-
《R语言电商数据分析》深度体验课-上海站 圆满结束,课件和代码见内
8月19日下午,PPV课《R语言电商数据分析》深度体验课-上海站在徐汇区凯旋路3580号楼顺利举行,吸引了不少感兴趣的同学参加,其中金融行业的占了1/3,也显示出上海金融行业的兴盛…
-
学习R语言,一篇文章让你从懵圈到入门
在实际工作中,每个数据科学项目各不相同,但基本都遵循一定的通用流程。具体如下: 数据科学工作流程 数据导入 数据整理 反复理解数据 数据可视化 数据转换 统计建模 作出推断(比如预…