hadoop核心组件与应用

HDFS解决底层的存储问题

yarn解决资源调度和任务管理。(资源调度:有了任务后,决定分配到哪些机器上执行;任务管理:任务在执行过程中,进行过程监控、状态反馈、再调度等工作)

MapReduce,解决分布式计算门槛高问题,基于其框架对分布式计算抽象的map和reduce,可以轻松写分布式计算程序

hive解决数据仓库构建问题,与mysql等数据库类同,知识它是基于hadoop平台的存储与计算

Streaming:解决非java开发人员使用hadoop平台的语言问题,使各种语言如c++,python,shell可以无障碍使用hadoop平台

Hbase:是一个基于列式存储的分布式数据库

ZooKeeper:分布式协同服务,主要用于单点故障场景中的master选举,namenode命名一致性等场景中








猜你喜欢

转载自blog.csdn.net/wflowerd/article/details/79255598