通过Ambari自动化部署hadoop集群(附Ansible安装脚本)

1、Ambari的工作原理与架构

Apache Ambari是一个大数据平台集成运维管理工具,它支持Apache Hadoop集群的部署、管理和监控。目前,Ambari已支持大多数Hadoop生态圈的组件,例如HDFS、MapReduce、 Hbase、Spark、Storm、Kafka、Druid、Zookeeper、Hive、Pig、Sqoop、Oozie等。

Ambari是一个分布式架构的应用工具,它主要由三部分组成,分别是Ambari Server、Ambari Agent、Ambari Web和Metrics Collector,基本运行原理是用户通过Ambari Server通知Ambari Agent安装指定的软件,Ambari Agent定时地发送各个机器上每个软件模块的运行状态给Ambari Server,同时Metrics Collector用来提供监控信息查询接口,供 Ambari Server进行查询,而Ambari Server会把所有状态信息汇总,最终呈现在Ambari的web页面上,以便于我们了解集群的各种状态数据,并进行相应的管理和维护。

2、安装与部署Ambari

1. 部署前准备工作

对于Ambari的安装,目前有两个可选发行版本,分别式是Apache的Ambari,另一个是Hortonworks的Ambari,这两个发行版本区别不大,但Apache的Ambari需要编译才能使用,而Hortonworks的Ambari提供了rpm包版本。因此安装更加简单,这里就使用Hortonworks的Amba

猜你喜欢

转载自blog.csdn.net/qq_35029061/article/details/132252509