课程大纲
培训对象:
· 计算机相关专业本科以上学历或有一年以上软件开发经验的人员。
· 有一定的英语基础,能阅读简单的英文文档。
· 学习能力强,渴望从事云计算行业.
· 拥有Linux 基本相关知识
· 拥有SQL数据库相关知识
· 具备Java开发技能(更好)
· 熟练使用一门编程语言:如C++,Java
· 对计算机基础有一定了解:如网络、数据结构、数据库等.
课程介绍:
目前Hadoop在很多企业应用越来越广泛,Hadoop人才也很稀缺和抢手,待遇也水涨船高。本系列课讲解目前主流的Hadoop版本Cloudera Hadoop 5(这里采用cdh5.1),该版本相比0.20.x,性能和稳定性上提高很多。CDH5环境搭建相比旧版本也复杂很多,但可以用Cloudera-Manager对集群进行管理和配置。CDH5默认集成了常用的所有组件如Hive、Sqoop、Hbase、Hue、Pig、Flume、Spark、Zookeeper等,从而形成一功能强大的分布式平台。
本课会分享一些本人所在团队研究的适用于企业级开发和应用的框架和工具,这些有效提高了开发效率,大大降低了维护成本,这些正是我们多年实战的结晶。
课程目标
· Hive Impala的基本使用以及自定义开发UDF
· Flume如何实现实时数据的收集
· Oozie任务调度系统如何使用
· Solr Cloud如何在Hadoop上应用
· Hue集成平台的使用
· Hadoop Keyberos权限管理维护
· Lily Hbase indexer 介绍
预备知识
· 拥有Linux 基本相关知识
· 拥有SQL数据库相关知识
· 具备Java开发技能(更佳)
适合对象
· 具有Linux 和数据库操作技能,对Hadoop大数据处理感兴趣的IT人
· 计算机相关专业本科以上学历或有一年以上软件开发经验的人员。
· 有一定的英语基础,能阅读简单的英文文档。
· 学习能力强,渴望从事云计算行业.
· 拥有Linux 基本相关知识
· 拥有SQL数据库相关知识
· 具备Java开发技能(更佳)
· 熟练使用一门编程语言:如C++,Java
· 对计算机基础有一定了解:如网络、数据结构、数据库等.
培训讲师:
· 长期企业应用 Hadoop 系统的资深培训讲师,具备美国 Cloudera 公司认证的Hadoop 管理员、开发员证书。
颁发证书:
上海慧谷职业技能培训中心证书。
认证考试:
· 参加 Cloudera Certified Administrator for Apache Hadoop (CCAH)
· 考试可以获得对应的 CCAH 证书。认证考试费用:3000 元/人
课程内容
1、Sqoop实战解析
· Sqoop原理
· Sqoop架构
· Sqoop使用详解
· 使用Sqoop 实现MYSQL/Oracle与HDFS/Hive进行数据传输
· 开源ETL工具kettle与Sqoop比较
· Sqoop应用场景
2、 Flume-Ng实战解析
· Flume-Ng原理
· Flume-Ng和老版本flume的架构上的区别
· Flume-Ng和其他开源实时收集系统的比较
· Flume-Ng的使用方法
· Flume-Ng收集数据到HDFS,Hbase
· Flume-Ng应用场景
· Flume-Ng监控
3、 Oozie任务调度系统使用介绍
· Oozie简介
· Oozie基本架构介绍
· Oozie-Workflow实战解析
· Oozie-Coordinator实战解析
· Oozie-Bundles实战解析
· Oozie调用Hive,Pig,Shell,Java,Stream等方法。
· Oozie任务监控报警
4、 Hue集成开放平台使用介绍
· Hue介绍
· Hue集成Hive,Impala介绍
· Hue 集成Oozie 图形化操作介绍
· Hue安装配置报警监控
5、 Solr,Lily Hbase 实战解析
· Solr Cloud和Lily Hbase实战解析
· 如何使用Lily 实时给Hbase创建索引收集数据到Solr
· 如何使用Lily 给HDFS文件创建Solr索引
6、 Spark实战解析
· Spark简介
· Spark架构
· Spark和其他开源流处理Storm的区别
· Spark应用场景
7、 附送:电商用户行为分析系统案例
· 如何收集网站用户行为数据
· 收集的数据如何落入Hadoop
· 如何处理业务逻辑来分析数据