1. 首页
  2. 数据挖掘

【深圳9月11日】Cloudera Hadoop培训课程,报名上课即免认证考试费!

【深圳9月11日】Cloudera Hadoop培训课程,报名上课即免认证考试费!

◆课程背景◆

Cloudera教育培训是全球领先的Apache Hadoop培训和认证厂商。我们所开发的全面解决方案可以针对Hadoop管理员、开发人员、数据分析师、数据科学家及任何大数据专业人士(利用企业数据中心(EDH)建立聚合应用)提供特定角色的培训。我们的培训内容深度覆盖整个生态系统的项目包括Spark、Solr、HBase、Pig、Hive、Impala、Hue、Sqoop及Oozie等工具。Cloudera培训教材源自各行业客户现实经验中的最佳实践,行业覆盖了金融服务业、医疗保健业、数字媒体业、零售业、制造业和电信业。

课程设置

Cloudera证书

【深圳9月11日】Cloudera Hadoop培训课程,报名上课即免认证考试费!

Cloudera认证

Cloudera Hadoop认证是最受业界认可的大数据权威认证,该领域的认证专业人士超过10,000人。Cloudera的 CCA(Cloudera Certified Associate)和CCP(Cloudera certified Professional)证书为您的技能提供了清晰的发展路径,不论是成为Hadoop开发人员、数据工程师、数据科学家或管理员。

Apache Hadoop的Cloudera认证管理员(CCAH)

课程概述:

通过CCAH认证的人员已经具备配置、部署、维护和保护公司和组织机构欲部署CDH所要求的ApacheHadoop集群方面的知识。

推荐学习:

  • Cloudera管理员培训。

CCA Spark和Hadoop开发人员认证

课程概述:

CCASpark和Hadoop开发人员已经证明了其核心开发人员的技能水平,并且可以编写和维护ApacheSpark和ApacheHadoop项目。

推荐学习:

  • Spark和Hadoop开发人员培训。

课程安排

地点/时间 课程 学员对象 学员基础

上海7月27-30日北京8月21-24日深圳9月11-14日上海9月27-30日

Cloudera Developer Training for Apache Hadoop(CCA-175)开发员培训 需要使用Apache Hadoop来开发功能强大的数据分析应用的程序开发人员 需具备程序设计经验,特别是Java方面的技能和背景
北京7月18-21日上海8月26-29日深圳9月5-8日北京9月18-21日 Cloudera Administrator Training for Apache Hadoop(CCA131)管理员培训 系统管理员或者任何需要管理Apache Hadoop机群的人员(包括产品及开发环境) 需要具备和掌握Linux系统管理和网络相关技能和经验
上海7月27-30日北京8月21-24日深圳9月11-14日上海9月27-30日 Cloudera Developer Training for Apache Spark (CCA-175)开发员培训 该课程适合具有一定编程经验的程序开发人员,课程样例和练习涉及到Python和Scala语言。 需要Linux的基本知识,事先无需Hadoop经验。

课程大纲

课程一:【Cloudera Apache Hadoop程序员课程】

课时:4天

学习Hadoop分布式文件系统(HDFS)基础和MapReduce框架以及如何利用其API来编写程序,

讨论为更大型的工作流程而设计技术。

这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。

程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。

在完成课程后,学员被鼓励参加Cloudera认证Apache Hadoop程序员(CCDH)考试。

【课程内容】

1、MapReduce与HDFS内核知识以及如何编写MapReduce程序

2、Hadoop开发的最佳实践,调试、实现工作流及通用算法

3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件

4、按需定制WritableComparables与InputFormats处理复杂的数据类型

5、利用MapReduce编写、执行连接操作以整合不同数据集合

6、用于现实世界数据分析所需的高级HadoopAPI主题

7、用Java写MapReduce程序,用Streaming写MapReduce程序

8、调试MapReduce代码的策略,利用localjobrunner在本地测试MapReduce代码

9、Partitioners和Reducers如何一起工作,定制化Partitioners

10、定制Writable和WritableComparable

11、用SequenceFile和Avro数据文件存储二进制数据

【学员基础】

该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习,熟悉Java者优先

【授课形式】案例教学+上机实践

课程二:【Cloudera Apache Hadoop管理员课程】

课时:4天

学习系统管理的概念和Apache Hadoop的最佳实践,

从安装和配置到负载均衡和调优。

这个4天的的课程通过动手时间来赋予你部署的经验,

以及更多的安全方面的经验和故障排除。

课程结束后,学员被鼓励去参加Cloudera和Apache Hadoop管理员(CCAH)考试。

【课程内容】

1、Hadoop分布式文件系统(HDFS)

2、YARN/MapReduce的工作原理

3、如何优化Hadoop机群所需要的硬件配置

4、搭建Hadoop机群所需要考虑的网络因素

5、Hadoop机群维护和控制

6、如何利用Hadoop配置选项进行系统性能调优

7、如何利用FairScheduler为多用户提供服务级别保障

8、Hadoop机群维护和监控

9、如何使用Flume从动态生成的文件加载到Hadoop

10、如何使用Sqoop从关系型数据加载数据

11、Hadoop生态系统工具(如Hive、Impala、Pig和Base)

【学员基础】

具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。

【授课形式】案例教学+上机实践

课程三:【Cloudera 数据分析课程】

课时:4天

针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。

学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能

来支持数据的转型和分析。

【课程内容】

1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据

2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程

3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据

4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组

5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据

6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能

7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例

8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询

9、impala和hive、pig、关系数据库的不同、使用impala shell

10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析

11、对比map reduce、pig、hive、impala和关系数据库

【学员基础】

该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员

事先无需Java和Apache Hadoop的经验

【授课形式】 案例教学+上机实践

课程四:【Cloudera Apache Spark程序员课程】

课时:4天

采用Apache Spark来创建集成了批处理,流计算和互动式分析的完整,统一的大数据应用。

学习编写复杂的并行应用来履行更快的商业决策和更好的用户产出,并将其应用到广泛的应用场景,架构和行业。

这门4天的课程针对那些希望在应用的速度,易用性和高级分析方面进行优化的程序员和软件工程师。

【课程内容】

1、用Spark shell执行互动式数据分析

2、Spark的弹性分布式数据集(Resilient Distributed Datasets)的特性

3、Spark怎样运行在一个集群上(一个独立的Spark集群)

4、Spark的并行编程、编写Spark应用、用Spark处理流数据

5、RDD Partitions和HDFS数据局部性、使用Partitions、并行操作

6、Spark应用对比Spark shell、创建Spark context、配置Spark shell属性

7、Spark Streaming简介、开发Spark Streaming应用

8、Streaming的Word Count、其他Streaming操作、滑动窗口操作

9、Spark、Hadoop和企业数据枢纽(EDH)

10、Spark和Hadoop生态圈、Spark和MapReduce

11、Caching and Persistence(RDD溯源、Caching缓存简介、分布式持久化机制)

【学员基础】

该课程适合具有一定编程经验的程序开发人员,课程样例和练习涉及到Python和Scala语言。

需要Linux的基本知识,事先无需Hadoop经验。

【授课形式】案例教学+上机实践

课程讲师

吴老师(Cloudera认证讲师)

【技术特长】

国内最早从事Hadoop研究的技术专家和Hadoop技术的传播者,不断的在实践中用Hadoop解决不同领域大数据的高效处理和存储问题。精通hadoop生态系统(hdfs,pig,hive,spark,mapred,solr,impala…)的各个组成部分,并具备源码级别的开发能力;对大规模集群计算,机器学习和并行算法有一定研究。

【项目经历】

1.中科院金属研究所GT4000HPC超级刀片计算机系统(72节点)的系统设计安装和调试工作,并参与了ANSYS堆焊问题实例计算的国家级课题项目。

2.军事医学科学院实时协作式超级刀片计算机(128节点)BIOS的研发,基于MPI的算法改进等工作。(当时linkpack测试世界排名世界第100位)。

3.内蒙古自治区医疗健康档案和电子病历等大数据平台搭建和软件开发和部署。主要负责HadoopMapReduce框架针对分散数据节点进行数据处理和数据集中的算法和软件开发工作。

4.负责浙江宁波电信账单实时查询系统的hadoopHbase存储以及Solr海量数据查询系统,BOSS系统的改进工作等。

【认证资质】

RHCARed Hat Certified Architect即红帽认证架构师。

(Cloudera Certified Administrator for Apache Hadoop)CCAH认证讲师

OCP:Oracle数据库认证专家(Oracle Certified Professional)

储备讲师:丁老师

解决方案顾问与认证讲师,任职于Cloudera(上海)软件有限公司。2012年北京大学毕业,获得计算机科学技术硕士学位。毕业后任职于摩根斯坦利,担任信息技术分析员的职位,主要负责金融报表生成监控系统的开发。之后加入英特尔亚太研发有限公司,从事大数据解决方案的设计与实现。3年项目开发经验,在英特尔与肯睿(Cloudera)专注于Hadoop方案的研发,主要参与新加坡DBS银行、印尼Telkomsel电信等大数据平台的设计、咨询工作。当前拥有CCAH(Cloudera认证Hadoop管理员)、CCDH(Cloudera认证Hadoop开发工程师)两项证书。

◆报名优惠

报名上课即免认证考试费(仅限深圳)

◆报名方式

1.点击“阅读原文”在线填写报名信息

2.缴纳预付款(详见报名表,或咨询在线客服)

3.上课前补交尾款

4.更多详情或QQ咨询1796318148.

原文始发于微信公众号(PPV课数据科学社区):【深圳9月11日】Cloudera Hadoop培训课程,报名上课即免认证考试费!

原创文章,作者:ppvke,如若转载,请注明出处:http://www.ppvke.com/archives/10611

联系我们

4000-51-9191

在线咨询:点击这里给我发消息

工作时间:周一至周五,9:30-18:30,节假日休息