因为上一份工作涉及到了大数据,让我对这个行业有了个初步的了解,再加上工作一年多,原公司不给涨薪,所以果断辞职,出去旅游了一段时间,刚回家准备脱产学习大数据,我会用博客来记录我的学习历程。
文件存储:Hadoop HDFS
离线计算:Hadoop MapReduce、Spark
流式、实时计算:Storm、Spark Streaming
K-V、NOSQL数据库:HBase、Redis
资源管理:YARN
消息系统:Kafka
查询分析:Hive、SparkSQL
分布式协调服务:Zookeeper
图形界面:Hue
数据同步:Sqoop
任务调度:Oozie
日志筹集:Flume