大数据学习困难?我给你分享一个学习思维

大数据基本是在Linux系统下操作,所以,学习大数据首先学的是Linux

1.Linux学习(首先认识Linux):

如何使用vmware安装linux镜像

认识linux的桌面环境、shell环境

在shell环境下进行文件系统的操作,掌握more、touch、cp、mv、rm等20多个常用命令

学习linux的网络管理,掌握ip、hostname等设置

学习vmware与linux的通信设置,掌握如何实现host-only、bridge、nat等网络连接方式

学习linux的进程管理,掌握如何查看、删除进程

学习linux的软件管理,掌握java、mysql等安装

学习环境变量配置,掌握如何设置环境变量

学习linux的ssh管理,掌握如何实现免密码登录

学习linux的防火墙管理,掌握如何关闭防火墙及开放指定端口

学习linux的调度管理,掌握crontab的使用

2.hadoop2学习(未细化):

搭建伪分布实验环境

HDFS体系结构及shell、java操作方式

MapReduce体系结构及各种算法

3.zookeeper学习

Zookeeper是什么

搭建zookeeper集群环境

如何使用命令行操作zookeeper

如何使用java操作zookeeper

4.HBase学习

hbase的概述

hbase的数据模型

hbase的表设计

hbase的伪分布式和集群安装

hbase的shell操作

hbase的JavaAPI操作

hbase的数据迁移

hbase的数据备份及恢复

Hbase结合Hive使用

hbase的集群管理

hbase的性能调优

5.CM+CDH集群管理学习

CM + CDH集群的安装

基于CM主机及各种服务组件的管理

CDH集群的配置和参数调优

CDH集群HA配置及集群升级

CM的监控管理

集群管理的注意事项



以上学习好了再看下一部分内容

在学习学习思维 上  以后,接下来,我给你分享一个学习思维第二部分

1.Hive学习

Hive支持的数据类型

Hive数据的管理

Hive的查询

Hive的函数

Hive的文件格式

项目实战

2.Sqoop学习

Flume的体系结构

flume的agent配置信息

flume如何动态监控文件夹中文件变化

flume如何把数据导入到hdfs中

讲解如何通过flume动态监控日志文件变化,然后导入到hdfs中

(以下学习方法和2类似)

3.Kafka学习     

4.Storm    

5.Oozie

6.Impala

7.Kettle

8.Ganglia


猜你喜欢

转载自blog.csdn.net/qq_42022255/article/details/80440772
今日推荐