初识Hadoop
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行运行和存储。
Hadoop中最重要的两个设计是:HDFS和MapReduce,其中HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算。
可以说Hadoop是大数据时代分析海量数据的一大利器,在系列博客中将介绍 Hadoop的安装, 使用方法和使用技巧。
-
安装具体介绍,如何在win10系统中安装VMware虚拟机并安装一个已经含有Hadoop的Linux系统
-
使用方法将具体介绍,虚拟机中Hadoop的使用方法,语法等,这部分知识会比较成体系,有没有办法进入体系的就放在使用技巧中介绍
-
使用技巧将记录我在使用Hadoop时所积累的不成体系的小技巧等,这部分会长期更新,也欢迎更多的朋友们与我讨论