1. 首页
  2. 数据分析

《Spark从入门到进阶(4天)》深圳班火热报名中,9月16日Spark生态系统及数据挖掘技术开课!

《Spark从入门到进阶(4天)》深圳班火热报名中,9月16日Spark生态系统及数据挖掘技术开课!

【课程背景】

随着科技的发展,极大地提高了数据生成的速度,已经远远超出了传统数据分析工具处理的能力;是否具备使用大规模分布式数据分析平台的能力,成为判定一个数据分析开发者能力高低的一个重要标准。 本课程重点在于讲授大规模数据分析的理念与开发实战,使得学员快速掌握基本的开发技巧。

【课程特色】

理论讲解与实操相结合,开发演示与现场指导相结合;以理论为基础,重点在于数据分析开发实战。

【教学目标】

1、学习大数据处理相关技术与理论;

2、全面学习使用spark生态系统进行数据分析的技术;

3、Spark及其相关框架进行快速机器学习的技术。

【目标用户】

有一定编程基础的数据分析爱好者,最好具备Java或者Python开发经验。

【老师介绍】

高老师,中国科学院博士后,主要研究方向为机器学习与推荐系统,曾以核心人员身份参与国家重大项目四项,在国内外学术期刊与会议上发表论文十余篇,申请发明专利多项,目前已授权一项。近年来,致力于机器学习技术在互联网企业中的应用与推广,已为电商、互联网、广告等领域公司设计并主持开发了数据分析系统七套。

【培训时间】9月16日~9月25日 逢周六周日上课(4天),9:00~12:00 13:30~17:00

【填写报名】: 点击“阅读原文”即可

【团购优惠】

1)3人以上9折,5人以上8折;

2)办理工信部专项技术证书(工本费400元/人)

《Spark从入门到进阶(4天)》深圳班火热报名中,9月16日Spark生态系统及数据挖掘技术开课!

【教学大纲】

第一天 Spark基础 1. Spark概述

2. Spark生态系统

3. Spark的安装与配置

4. Spark开发环境的搭建

5. Spark交互式工具Spark-shell的使用

Spark的编程模型 1. Spark计算模型

2. RDD基础

3. RDD的操作、特点与依赖关系

4. 持久化机制

5. Transformation、Action算子及其功能介绍

第二天 Spark SQL 1. Hive入门

2. 数据的读取与存储

3. Spark SQL进阶操作

4. Spark SQL实战示例

Spark Streaming实时机器学习 1. Spark Streaming原理

2. Spark Streaming运行方式

3. Spark Streaming的缓存与容错

4. Spark Streaming实战示例

第三天 使用MLib进行机器学习 1. 机器学习基础概述

2. 常用机器学习算法讲解

分类算法

聚类算法

回归算法

特征选择

1. MLib中机器学习算法的使用

2. MLib实战示例

图运算与GraphX基础 1. 图论基础

2. GraphX架构概述

3. GraphX实战示例

第四天 Spark的运维 1. 运行架构概述

2. Standalone运行过程

3. Spark on YARN

4. Spark性能优化基础

Spark源码阅读入门与企业应用概述

【近期掠影】

《Spark从入门到进阶(4天)》深圳班火热报名中,9月16日Spark生态系统及数据挖掘技术开课!

咨询电话:400-070-7620

在线QQ①:1796318148 在线QQ②:149104196

原文始发于微信公众号(PPV课数据科学社区):《Spark从入门到进阶(4天)》深圳班火热报名中,9月16日Spark生态系统及数据挖掘技术开课!

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/12246

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息