1. 首页
  2. 数据分析

【1/30-31培训】Hadoop大数据最佳实践研修班第二期

一、课程基本信息

课程名称:Hadoop大数据最佳实践研修班 第二期

培训天数:2天

培训费用:980/人 可申请工信部证书200元/人

培训时间:2016年1月30-31日

培训地点:深圳

报名方式:点击底部阅读原文报名填写报名表

二、培训对象

需要了解大数据,或者需要熟知大数据管理、维护、开发和数据分析的人

学员基础无需具备Hadoop基础和经验,只需要基本的数据库基础

培训资料:培训讲义

培训方式:全程上机练习,理论与案例相结合,资深顾问授课及辅导,小班授课保证质量

颁发证书:工信部《大数据技术》初级证书

参加学员可获得由工信部全国通信及信息技术培训考试专项技术项目《大数据技术》职业水平证书

三、教学目标

熟悉Hadoop分布式文件系统;了解MapReduce工作原理;熟知Hadoop集群硬件配置规划;懂得Hadoop集群配置及优化;学会如何维护和监测Hadoop集群;学会怎么使用Sqoop连接关系数据库进行数据导入导出;了解Hive数据仓库的开发和应用;Hue的web页面的数据库开发;精通Hbase列式数据库的开发;掌握大数据挖掘分析基础;了解数据挖掘常见的几种工具和对比;了解几种常用的挖掘算法原理;了解大公司对大数据的应用场景和未来方向

四、讲师介绍

陈老师:九年相关项目经历,长期从事大数据相关的工作,精通大数据技术,熟悉关系型数据库oracle10GMysql等;精通Hbase、HDFS、Hive、Pig等开源技术,对实时处理Storm、Impala有较深的认识,熟悉分布式计算MapReduce。非常精通数据挖掘算法和解决方案,比如决策树、K-means、预测分析、Logistc线性回归、Apriori算法应用熟悉电信、移动、电力、证券、网络、物流等业务。

五、学习内容

第一天:

第一部分:如何构建分布式数据仓库平台

1.怎么样才算是真正意义的大数据平台

2.开源Hadoop生态系统的介绍

3.数据采集过程与分布式存储

1)ETL介绍

2)Sqoop

3)HDFS

4.数据仓库与数据分析

1)MapReduce

2)Hive

3)Pig

4)HBase

5.集群监控与调度组件

1)Hadoop集群权限管理

2)Hbase列数据库监控

3)Hive集群监控

3)Oozie介绍

6.Hue介绍和例子讲解

7.练习

8.案例讲解

1)运营商全国用户上网记录案例介绍

2)IBM网上舆情分析

第二部分:大数据平台部署及案例

1.我们应该选哪种Hadoop?

1)选哪个版本?为什么?

2)优点和缺点

2.集群硬件应该如何选配?

1)网络拓扑

2)内存

3)硬盘

4)CPU

5)价格

3.部署案例讲解

1)英特尔Hadoop发行版详解

2)某省级通信运营商清帐单查询系统介绍

第二天:

第三部分:Hbase列数据库及应用案例

1.Hbase感性认识

1)Hbase简介

2)Hbase特点

3)HBase与RDBMS对比

4)HBase体系结构

5)Hbase常见概念

2.Hbase主要组成

1) HBase基本命令介绍

2) Zookeeper、Hmaster

3) HRegionServer、Region

4) HStore存储、Hfile

5) Hbase内部扫描RowKey的原理

6) Hbase内部读写原理

7) HBase设计原理、架构分析

8) Hadoop+HBase伸缩性(自动扩容、热部署)

9) HBase相关表结构设计(列族、列详细分析)

10) HBase主HMaster与备用HMaster间的切换原理

3.Hbase性能测试

1) 测试数据

2) 测试过程

3) 测试结论

4) 和oracle rac等进行对比

4.Hbase设计原则和优化

1) Hbase的RowKey设计原则

2) 性能参数的设置

3) 性能参数的调整

4) 模型和性能优化

5.练习

6.项目案例:

1) HBase在小米业务的应用

第四部分:大数据挖掘介绍与应用案例

1.大数据挖掘几种方法

1)传统数据挖掘

2)SPSS_Modeler14.2

3)SAS简介

4)Mahout简介

5)R语言详解

6)RhadoopRhive

2.算法介绍和应用

1)关联分析

2)K-Means

3)决策树C5.0

4)Logistic回归

5)主成分/因子分析

6)Apriori算法

7)预测算法

8)神经网络

9)协同过滤挖掘算法

3.项目案例详解

1)用户行为编好分析

2)客户流失预测分析

3)营销产品推荐系统

4)TF-IDF与余弦相似性的应用

5)电力行业的大数据应用

六、联系方式

电话:4000-707-620QQ:2941275750(PPV课_lily)

点击下方“阅读原文”填写报名表
↓↓↓

原文始发于微信公众号(PPV课数据科学社区):【1/30-31培训】Hadoop大数据最佳实践研修班第二期

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/16874

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息