大数据环境比较复杂,并不像学习编程软件一样,机器安装一下,跟老师敲几行代码就可以了,大数据学习起来可要麻烦多了,至少要准备好虚拟化的集群环境,然后又要安装部署各种计算框架,所以需要有耐心,有一定解决问题的能力,坚持不懈,才有可能学好大数据。
千锋老师通过社会调研和企业走访,针对零基础小白制定了一套大数据的学习路线图,大家可以参考学习了!
第一阶段 Java语言基础阶段
1.1 Java编程语言基本概述
1.2 Java基础语法
1.3 面向对象编程
1.4 面向对象高级编程
1.5 Java中的常用类库
1.6 枚举和异常类
1.7 Java数据结构和集合框架泛型
1.8 Java中的IO流
1.9 Java中的多线程
1.10 Java中网络编程和反射
1.11 Java8新特性
1.12 Java基础加强
第二阶段 Linux系统&Hadoop生态体系
01 Linux入门
02 常用基本命令
03 系统管理
04 Linux操作增强
05 Linux shell编程
06 Hadoop生态
07 分布式系统概述
08 Hadoop入门
09 Hadoop伪分布式
10 Hadoop全分布式
11 HDFS基本概念
12 HDFS的应用开发
13 HDFS的IO流操作
14 NameNode工作机制
15 DataNode工作机制
16 Zookeeper入门
17 Zookeeper详解
18 HA框架原理
19 Hadoop-HA集群配置
20 MapReduce框架原理
21 Shuffle机制
22 Mapreduce案例一
23 Mapreduce案例二
24 Hive入门
25 Hive DDL数据定义
26 Hive分区表
27 Hive分桶表
28 Hive查询
29 Hive的高级查询Join与排序
30 Hive的函数
31 Hive DML数据管理
32 Hive文件存储
33 Hive企业级调优
34 Hive企业级调优二
35 Hive企业级项目实战
36 Flume详解
37 Sqoop详解
38 Hbase概念
39 Hbase的操作
40 Hbase整合
41 Hbase的实战和优化
第三阶段 分布式计算框架
3.1 scala
3.2 Spark Core
3.3 Spark SQL
3.4 Spark Streaming
3.5 kafka
3.6 ElasticSearch
3.7 Logstash
3.8 Kibana
3.9 Kibana
第四阶段 大数据实战项目
以北京的中关村、西二旗等IT密集的公司为技术背景。如:sina微博的DSP广告大数据分析平台、百度搜索引擎挖掘计算流量等。
标准的大数据团队流程:项目分析,业务分析,数据量分析,技术实现,数据表的设计,线下功能调试,性能调优,数据倾斜, Trouble Shooting等,掌握此流程,大数据P7级别。
第五阶段 大数据分析
5.1 Data Analyze数据分析基础
5.2 工作环境准备
5.3 数据可视化的概念与准则
5.4 Python机器学习
5.5 选择模型
5.6 构建树的过程
5.7 网格搜索
5.8 sklearn中有三类朴素贝叶斯算法
5.9 颜色特征
5.10 手写数字识别
5.11 文本的基本组成
5.12 文本的基本组成
以上就是详细版的大数据学习路线图,学习的小伙伴可以把它当做一个基础的框架,进行多维度学习!