课程亮点0
第二阶段:HADOOP生态圈
特点
本阶段要求学员掌握大数据离线处理中的基本框架:HADOOP、ZOOKEEPER、HIVE、
FLUME、HBASE等。同时本阶段会深入讲解各个框架中设计到的部分算法和源码。
要求
掌握ZOOKEEPER的基本操作,了解ZOOKEEPER的源码和PAXOS算法
了解HADOOP发展历程,掌握HADOOP的分布式、高可用模式搭建
掌握HDFS的基本操作、原理和基本流程,了解HDFS的特点
掌握MAPREDUCE的SHUFFLE过程,掌握YARN的基本流程,了解YARN的常见优化
掌握FLUME的流动模型,了解FLUME的自定义组件
掌握HIVE的基本语法,了解HIVE的编译过程、自定义组件、优化过程
掌握HBASE的基本操作和原理,了解HBASE的常见优化
核心技能
ZOOKEEPER的搭建及基本操作
MAPREDUCE各组件及SHUFFLE过程
FLUME流动模型搭建、自定义组件
HBASE的搭建、基本操作、读写流程和优化
HDFS的基本操作、NAMENODE、DATANODE、读写流程
HIVE基本语法、自定义组件、编译过程及优化
完善的课程体系,涵盖市面主流大数据框架
第三阶段:SPARK生态圈
特点
本阶段要求学员掌握SCALA语言以及大数据常用实时框架KAFKA、SPARK等。在课程中
会讲解各个框架的源码及优化,辅助学员更好的理解和掌握各个框架。
要求
掌握SCALA的基本语法,熟悉SCALA的集合操作
掌握KAFKA的搭建以及操作,熟悉KAFKA的架构、数据策略等
掌握SPARK的搭建以及操作,熟悉SPARK中RDD、DAG、DATAFRAME、DATASET
等概念和操作
掌握SPARKSQL,熟悉自定义组件、大小表JOIN、表优化的问题
更多培训课程,学习资讯,课程优惠,课程开班,学校地址等学校信息,请进入北京Fesco国际教育官方网站详细了解