Cloudera Hadoop认证培训课程

我们所开发的全面解决方案可以针对Hadoop管理员、开发人员、数据分析师、数据科学家及任何大数据专业人士(利用企业数据中心(EDH)建立聚合应用)提供特定角色的培训。我们的培训内容深度覆盖整个生态系统的项目包括Spark、Solr、HBase、Pig、Hive、Impala、Hue、Sqoop及Oozie等工具。
大数据是“科技革命”,未来一年内近三分之一的公司已投资或计划投资在大数据技术。这一趋势给想要转型从事大数据方面工作的人员提供了难得的职业发展机会。

课程背景:

Apache Hadoop 企业培训 今天诞生的数据的数量和多样性是史无前例的。 成功的组织都明白,数据越多意味着对业务, 客户和产品的复杂精细的分析越多。 不幸的是,传统的系统的设计没有足够的扩展性可以赶上现今 数据涌现的步伐。
Apache Hadoop 释放了蕴藏在海量的结构化和非结构化的数据里的可操作的价值,使得组织可以 回答过去不能想像的问题,并提升业务流程和与客户的互动。 Hadoop 补充了现有的技术, 是一 个统一的处理和分析海量多结构数据的理想平台。 由于其带来的独有的商业价值, 对Hadoop 技 能的需求正迅速增涨。
Apache Hadoop 培训和认证的机构。我们全面的解决方案套装提供 了面向Hadoop管理员,程序员,数据分析师和数据科学家的针对不同角色的培训,为正在利用企业数据枢纽而建立聚合式应用的大数据专家提供了深入覆盖生态系统项目的培训,包括:Spark, HBase, Pig, Hive, Impala, Search, Hue, Sqoop和 Oozie 。Cloudera 大学课程的开发采用了源 于Cloudera与其所有行业的客户的最佳实践,包括金融服务, 卫生保健,数字媒体,零售,生 物科学和电信。
大数据培训课程的合作伙伴Cloudera 大学从2009年开始已经累计培训了超过40,000 位学员, 学员包括了来自Fortune 100中60%的企业和全部20个全球顶尖技术公司的数据专家。几乎 95% 的学员会向其同事或朋友推荐或强烈推荐Cloudera 的培训。我们的培训基于 CDH, Cloudera的 100% 开源分发版,目前为止是世界 上部署最为广泛的 Hadoop 分发版。
大数据培训的课程在全球范围提供, 比如在公开课堂,在实况在线的虚拟环境,在一个内容按 需裁剪,地点坐落在客户私有场所的现场。 通过Cloudera 大学合作伙伴, 我们的课程也在全球 许多顶尖的学院教授。 无论你现有的Apache Hadoop经验的多寡, 大数据培训总有一门适合你需求的课程。
当今世界所产生的数据种类和数量是史无前例的。成功的企业意识到数据越多可能意味着对其业务、客户和产品的分析越复杂。然而,传统系统的设计已经跟不上数据创建的速度。
您的企业准备好接受挑战了吗?
Cloudera教育培训是全球领先的Apache Hadoop培训和认证厂商。我们所开发的全面解决方案可以针对Hadoop管理员、开发人员、数据分析师、数据科学家及任何大数据专业人士(利用企业数据中心(EDH)建立聚合应用)提供特定角色的培训。我们的培训内容深度覆盖整个生态系统的项目包括Spark、Solr、HBase、Pig、Hive、Impala、Hue、Sqoop及Oozie等工具。Cloudera培训教材源自各行业客户现实经验中的最佳实践,行业覆盖了金融服务业、医疗保健业、数字媒体业、零售业、制造业和电信业。
Cloudera培训通过以下方式提供课程:

  • 通过您的电脑或iOS设备按需提供资源库
  • 公共课程
  • 网上在线虚拟环境
  • 定制的客户现场培训
  • Cloudera Administrator Training for Apache Hadoop(CCAH)
  • Cloudera Developer training for Spark and Hadoop(CCA)
  • Cloudera Developer Training for MapReduce
  • Cloudera Data Analyst Training: Using Pig, Hive, and Impala
    Designing and Building Big Data Applications
    6.Data Science at Scale using Spark and Hadoop
    7.Cloudera Developer Training for Apache Spark
  • Cloudera Training for Apache HBase

9.Cloudera Search Training
我们还通过Cloudera学术合作伙伴(CAP)在世界各地超过百所顶尖高校设置课程。无论您是否具有使用 Apache Hadoop 的经验,Cloudera培训总能提供一项满足您需求的培训课程。
 

课程设置:

Cloudera 证书 考试证书 结业证书 Cloudera 认证 Cloudera Hadoop认证是最受业界认可的大数据权威认证,该领域的认证专业人士超过10,000人。Cloudera的 CCA(Cloudera Certified Associate)和CCP(Cloudera certified Professional)证书为您的技能提供了清晰的发展路径,不论是成为Hadoop开发人员、数据工程师、数据科学家或管理员。
 
Cloudera CDH企业级的Hadoop标准,100%开源:
Cloudera CDH (Cloudera Distribution Including Apache Hadoop)是Cloudera的100%开源平台分发版,它包含了Apache HadoopTM,并且特别创建了来满足企业的需求。作为最为广泛部署的Hadoop分发版,Cloudera CDH正运行在比如银行,电信,媒体,零售,政府等这样的最大型的组织里的扩建至数百个节点的生产环境里。
Cloudera CDH包含Apache Hadoop和超过两位数的其他领先的开源项目,Cloudera CDH将存储和计算集成进单一的,可扩展的系统,交付了用户大数据运营所要求的灵活性和经济性,而这些运营如果采用传统的解决方案,限于时效性和成本,是根本不可能实现的。通过赋予您以下的能力,Cloudera CDH讲帮助您操作您的数据,驱动您的业务:
>>将存储和计算统一到单一的系统资源池内;
>>存储任意格式的数据,不会受限于苛刻的数据架构;
>>将一个计算框架的灵活数组带入一个单一数据池-包括批处理,交互式SQL,交互式搜索,机器学习,流处理及一系列的第三方应用;
>>以并行方式,在具有线性扩展性的地方处理数据;
>>实时向用户和应用交付数据;
>>与您现有的数据管理和分析工具集成;

Apache Hadoop的Cloudera认证管理员(CCAH)

课程概述:
通过CCAH认证的人员已经具备配置、部署、维护和保护公司和组织机构欲部署CDH所要求的ApacheHadoop集群方面的知识。
推荐学习:

  • Cloudera管理员培训。

 

CCA Spark和Hadoop开发人员认证

课程概述:
CCASpark和Hadoop开发人员已经证明了其核心开发人员的技能水平,并且可以编写和维护ApacheSpark和ApacheHadoop项目。
推荐学习:

  • Spark和Hadoop开发人员培训。

cloudera%e5%85%a8%e7%90%83%e9%80%9a%e7%94%a8%e8%af%81%e4%b9%a6

CCP数据科学家认证

课程概述:
CCP数据专家已经展现出专家精英群体在大数据工作方面的技能。候选人员必须在现实条件下证明了自己的能力,设计和开发可用于生产的数据科学解决方案,并且该解决方案经同行评估认定具备准确性、可扩展性和稳健性。
推荐学习:

  • Spark和Hadoop开发人员培训;
  • ClouderaCCP数据专家准备套件。

数据专家候选人员应该具备大数据工具使用经验、深厚的Hadoop知识、以及专家级的解决实际数据工程问题的能力。
 

CCP数据工程师认证

课程概述:
CCP数据工程师具备开发可靠、自主、可扩展数据管道的技能,可为各种工作负载优化数据集。
推荐学习:

  • Spark和Hadoop开发人员培训;
  • 大数据应用程序的设计与构建。

CCP数据工程师候选人员应该具备大数据工具使用经验、深厚的Hadoop知识、以及专家级的解决实际数据工程问题的能力。
 

课程大纲:

地点/时间 课程 学员对象 学员基础

深圳11月25-28日

上海12月28-31日


Cloudera Developer Training for Spark and Hadoop(CCA-175) 开发员培训 该课程适合具有一定编程经验的程序开发人员,课程样例和练习涉及到Python和Scala语言。 需要Linux的基本知识,事先无需Hadoop经验。

北京12月21-24日

上海12月28-31日

Cloudera Administrator Training for Apache Hadoop(CCA131)管理员培训 系统管理员或者任何需要管理Apache Hadoop机群的人员(包括产品及开发环境) 需要具备和掌握Linux 系统管理和网络相关技能和经验
上海12月2-5日 Cloudera Data Analyst Training: Using Pig, Hive and Impala with Hadoop(CCA159)数据分析师培训 需要使用 Hadoop来进行数据分析的数据分析员,商业分析员,开发员以及系统管理员 建议需具备 SQL、简单 Unix/Linux 命令和脚本编程经验。

 

  课程一: 【Cloudera Apache Hadoop程序员课程】 课时:4天
学习Hadoop分布式文件系统(HDFS)基础和MapReduce框架以及如何利用其API来编写程序,
讨论为更大型的工作流程而设计技术。
这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。
程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。
在完成课程后,学员被鼓励参加Cloudera认证Apache Hadoop程序员(CCA)考试。
【课程内容】

1、MapReduce与HDFS内核知识以及如何编写MapReduce程序

2、Hadoop开发的最佳实践,调试、实现工作流及通用算法

3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件

4、按需定制WritableComparables与InputFormats处理复杂的数据类型

5、利用MapReduce编写、执行连接操作以整合不同数据集合

6、用于现实世界数据分析所需的高级HadoopAPI主题

7、用Java写MapReduce程序,用Streaming写MapReduce程序

8、调试MapReduce代码的策略,利用localjobrunner在本地测试MapReduce代码

9、Partitioners和Reducers如何一起工作,定制化Partitioners

10、定制Writable和WritableComparable

11、用SequenceFile和Avro数据文件存储二进制数据

【学员基础】

该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习,熟悉Java者优先

【授课形式】案例教学+上机实践
  课程二:【Cloudera Apache Hadoop管理员课程】 课时:4天
学习系统管理的概念和Apache Hadoop的最佳实践,
从安装和配置到负载均衡和调优。
这个4天的的课程通过动手时间来赋予你部署的经验,
以及更多的安全方面的经验和故障排除。
课程结束后,学员被鼓励去参加Cloudera和Apache Hadoop管理员(CCAH)考试。
【课程内容】

1、Hadoop分布式文件系统(HDFS)

2、YARN/MapReduce的工作原理

3、如何优化Hadoop机群所需要的硬件配置

4、搭建Hadoop机群所需要考虑的网络因素

5、Hadoop机群维护和控制

6、如何利用Hadoop配置选项进行系统性能调优

7、如何利用FairScheduler为多用户提供服务级别保障

8、Hadoop机群维护和监控

9、如何使用Flume从动态生成的文件加载到Hadoop

10、如何使用Sqoop从关系型数据加载数据

11、Hadoop生态系统工具(如Hive、Impala、Pig和Base)

【学员基础】

具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。

【授课形式】

案例教学+上机实践

  课程三:【Cloudera Apache HBase课程】

课时:4天

学习如何将HBase作为一个分布式的数据储存以实现低延迟的查询和高扩展的吞吐。
这4天的课程涵盖了HBase架构、数据模型、Java API及其他高级课题和最佳实践。
完成该课程后,学员被鼓励参加cloudera认证Apache HBase专家(CCSHB)考试来验证和认证其Hadoop经验。
【课程内容】

1、什么是HBase、为什么要用HBase,HBase和RDBMS,HBase的给予和索取

2、HBase系统管理API,HBase Shell、创建表、HBase Java API、系统管理调用

3、通过HBase API访问数据,API的使用、数据检索、在shell添加和更新数据、删除数据

4、用API添加、更新数据,Scan API、高级API技术、使用Eclipse

5、集群组件、HBase如何扩展,HBase写路径、读路径,压缩和拆分

6、HBase的安装、配置及其安全性

7、HBase daemnon、ZooKeeper、HBase系统管理

8、复制、备份、MapeRduce和HBase集群

9、HBase里RowKey设计,从关系数据库到HBase表结构设计,以应用为中心的设计

10、列族、表结构设计的考虑点、热点处理

11、HBase生态系统:OpenTSDB、Kiji、HBase和hive

【学员基础】
该课程适合需要使用HBase的开发员和管理员。
预备的数据库和数据建模的经验有帮助,但不是必须的。
预备的Java知识有帮助,Hadoop经验不是必须的,
但是cloudera的Apache Hadoop开发培训课是个绝佳的基础。
【授课形式】案例教学+上机实践
  课程四: 【Cloudera 数据分析课程】

课时:4天

针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。
学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能
来支持数据的转型和分析。
 
【课程内容】

1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据

2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程

3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据

4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组

5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据

6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能

7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例

8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询

9、impala和hive、pig、关系数据库的不同、使用impala shell

10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析

11、对比map reduce、pig、hive、impala和关系数据库

【学员基础】
该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员
事先无需Java和Apache Hadoop的经验
【授课形式】    案例教学+上机实践
  课程五: 【Cloudera Apache Spark程序员课程】 课时:4天
采用Apache Spark来创建集成了批处理,流计算和互动式分析的完整,统一的大数据应用。
学习编写复杂的并行应用来履行更快的商业决策和更好的用户产出,并将其应用到广泛的应用场景,架构和行业。
这门4天的课程针对那些希望在应用的速度,易用性和高级分析方面进行优化的程序员和软件工程师。
 
【课程内容】

1、用Spark shell执行互动式数据分析

2、Spark的弹性分布式数据集(Resilient Distributed Datasets)的特性

3、Spark怎样运行在一个集群上(一个独立的Spark集群)

4、Spark的并行编程、编写Spark应用、用Spark处理流数据

5、RDD Partitions和HDFS数据局部性、使用Partitions、并行操作

6、Spark应用对比Spark shell、创建Spark context、配置Spark shell属性

7、Spark Streaming简介、开发Spark Streaming应用

8、Streaming的Word Count、其他Streaming操作、滑动窗口操作

9、Spark、Hadoop和企业数据枢纽(EDH)

10、Spark和Hadoop生态圈、Spark和MapReduce

11、Caching and Persistence(RDD溯源、Caching缓存简介、分布式持久化机制)

【学员基础】
该课程适合具有一定编程经验的程序开发人员,课程样例和练习涉及到Python和Scala语言。
需要Linux的基本知识,事先无需Hadoop经验。
【授课形式】

案例教学+上机实践

 
  课程六:【Designing and Building Big Data Applications】(数据建模) 课时:4天
学习运用Apache Hadoop和企业数据枢纽中的关联工具来分析和解决实际问题,
你会遍历其设计和创建的整个过程,包括数据导入,决定恰当的文件格式来存储,
处理预存的数据,及用一个容易理解消化的形式向最终用户呈现结果。
这门4天的课程面向那些需要研发高度业务相关的应用的数据家。
 
【课程内容】

1、定义使用Data Sets,Metadata管理、Apache Avro、Avro Schemas演变

2、什么是the Kite SDK ,Fundamental Data Module基础概念Concepts,用Kite SDK创建新数据组

3、用Apache Sqoop输入关系数据,基本输入、限制结果、提升Sqoop性能、Sqoop 2

4、用Apache Flume捕获数据,Flume自定义组开发、使用Flume自定义拦截器写Avro对象

5、采用Apache Oozie管理工作流,定义Oozie工作流,验证、封包、部署,Oozie的Hue用户界面

6、用Apache Crunch处理数据管道,对比Crunch和Java mapreduce,应用Crunch projects,Crunch API的工具分级

7、使用Apache Hive里的表格,Basic Query Syntax,在Hive里采用RegexSerDe

8、开发用户定义功能,实现一个用户定义功能,用Impala执行互动式查询,数据和元数据管理

9、理解Cloudera Search,Search架构、支持的文件格式

10、用Cloudera Search创建索引,Collection and Schema Management,Morphlines

11、Solr Query Sybtax,采用Hue创建搜索UI,通过JDBC访问Impala,用Impala和Search增强定制的web应用

【学员基础】
该课程最适合需要使用Hadoop及其相关工具来解决现实问题的程序员、工程师和架构师。
学员应该预先参加过cloudera的Apache Hadoop程序员培训或有相当的实践经验。
需要良好的Java知识,熟悉Linux。SQL经验会有帮助。

课程讲师:

吴老师(Cloudera认证讲师) 【技术特长】 国内最早从事Hadoop研究的技术专家和Hadoop技术的传播者,不断的在实践中用Hadoop解决不同领域大数据的高效处理和存储问题。精通hadoop生态系统(hdfs,pig,hive,spark,mapred,solr,impala…)的各个组成部分,并具备源码级别的开发能力;对大规模集群计算,机器学习和并行算法有一定研究。 【项目经历】 1.中科院金属研究所GT4000HPC超级刀片计算机系统(72节点)的系统设计安装和调试工作,并参与了ANSYS堆焊问题实例计算的国家级课题项目。
2.军事医学科学院实时协作式超级刀片计算机(128节点)BIOS的研发,基于MPI的算法改进等工作。(当时linkpack测试世界排名世界第100位)。
3.内蒙古自治区医疗健康档案和电子病历等大数据平台搭建和软件开发和部署。主要负责HadoopMapReduce框架针对分散数据节点进行数据处理和数据集中的算法和软件开发工作。
4.负责浙江宁波电信账单实时查询系统的hadoopHbase存储以及Solr海量数据查询系统,BOSS系统的改进工作等。 【认证资质】 RHCARed Hat Certified Architect即红帽认证架构师。
(Cloudera Certified Administrator for Apache Hadoop)CCAH认证讲师
OCP:Oracle数据库认证专家(Oracle Certified Professional) 储备讲师:丁老师 解决方案顾问与认证讲师,任职于Cloudera(上海)软件有限公司。2012年北京大学毕业,获得计算机科学技术硕士学位。毕业后任职于摩根斯坦利,担任信息技术分析员的职位,主要负责金融报表生成监控系统的开发。之后加入英特尔亚太研发有限公司,从事大数据解决方案的设计与实现。3年项目开发经验,在英特尔与肯睿(Cloudera)专注于Hadoop方案的研发,主要参与新加坡DBS银行、印尼Telkomsel电信等大数据平台的设计、咨询工作。当前拥有CCAH(Cloudera认证Hadoop管理员)、CCDH(Cloudera认证Hadoop开发工程师)两项证书。

报名方式:

报名表单:41569718

咨询热线:

电话 4000-707-620 QQ :1796318148

报名表单

原创文章,作者:PPV课,如若转载,请注明出处:http://www.ppvke.com/Blog/archives/1365

发表评论

登录后才能评论

评论列表(1条)

  • stockings 2016年4月8日 02:36

    Very neat post. Cool.

联系我们

在线咨询:点击这里给我发消息

工作时间:周一至周六,9:30-19:30,节假日休息
热线电话:0755-32843501

QR code