HDFS解决底层的存储问题
yarn解决资源调度和任务管理。(资源调度:有了任务后,决定分配到哪些机器上执行;任务管理:任务在执行过程中,进行过程监控、状态反馈、再调度等工作)
MapReduce,解决分布式计算门槛高问题,基于其框架对分布式计算抽象的map和reduce,可以轻松写分布式计算程序
hive解决数据仓库构建问题,与mysql等数据库类同,知识它是基于hadoop平台的存储与计算
Streaming:解决非java开发人员使用hadoop平台的语言问题,使各种语言如c++,python,shell可以无障碍使用hadoop平台
Hbase:是一个基于列式存储的分布式数据库
ZooKeeper:分布式协同服务,主要用于单点故障场景中的master选举,namenode命名一致性等场景中