大数据工程师培训班通知

 

培训地点

北京市计算中心

(北京市海淀区丰贤中路7号北科产业3号楼)

培训时间

2018年7月15日-7月19日

 课程为多期,其他时间其他地点还有相同课程安排,具体请加微信咨询。

一、培训收益

本培训课程主要从组件的架构原理、安装、配置、运维、调优等方面进行讲解。通过此次课程培训,可使学习者获得如下收益:

1、掌握大数据平台实现安装、配置、监控;

2、理解并掌握分布式存储 HDFS 上的文件操作及运维命令;

3、外部数据导入 Yarn 运行、调度Spark 任务 ;

4、 SQL on Hadoop;

5、掌握分布式下的事务操作;

6、掌握基于内存/SSD 的优化加速;

7、理解并掌握Hyperbase 数据库。

 

二、培训特色

1、课程注重学练结合的方法,会采取课中练习的方法,充分调动学习者思考的积极性,在做中掌握相关知识和技能;

2、专家讲师精彩内容解析、学院专题讨论、研究;

3、通过全面知识理解、技能演示和实践引导学员掌握课程内容。

 

三、培训人群及预备技能

1、运维实施工程师;

2、系统管理员;

3、IT项目经理。

要求熟练使用Linux、了解SQL语法及数据库基本概念。

四、培训费用

培训费6000元/人(含培训费、场地费、资料费),食宿自理。

报名咨询:


 

五、课程大纲

序号

课程大纲

1

大数据简介

2

分布式存储 HDFS

HDFS 的特点

内部角色 NameNode 与 DataNode

文件的可靠性存储

解析文件读写过程

Client 操作 HDFS 的常用命令

运维管理 HDFS

3

分布式资源调度 Yarn

Yarn 架构与 Resource Manager、Node Manager

分布式资源封装与管理

Yarn 下的调度器策略

解析作业提交执行过程

4

分布式计算框架

MapReduce 特点

解析 Mapper—Reducer 运行机制

高性能的计算框架 Spark

弹性分布式数据集 RDD 与DAG

5

NoSQL 数据库 Hyperbase

Hyperbase 中的数据模型

架构与 Master、RegionServer

数据读写流程

非结构化数据存储 Object Store 简介

丰富的索引组合

SQL for Elastic Search

6

SQL 执行引擎

组成架构介绍

SQL 语法介绍之 DDL

SQL 语法介绍之 DML

SQL 语法介绍之 DQL

存储过程介绍

大数据量下的通用优化策略

各种表的总结与应用场景选择

7

大数据平台流处理

流处理概念

SQL 定义语法

8

平台安全管控

安全协议

各组件安全下的操作

9

集群规划与运维诊断

10

总结

猜你喜欢

转载自blog.csdn.net/wanghr323/article/details/81041660