Flume 入门学习

Hadoop 相关组件

Flume 入门学习


前言

一、flume是什么?

flume是一个可分布式日志收集系统,为hadoop相关组件

可采集数据文件,socket数据包,文件夹,kafka,mysql数据库等各种形式源数据,并将采集数据下沉sink输出到hdfs,kafka,hbase,hive等众多外部存系统中

二、flume特性

flume是一个分布式,可靠,和高可用的海量日志采集,汇聚和传输的系统。

三、flume核心

1.agent

每个agent相当于一个数据传递员,内部有3个核心组件
  1. Source:采集组件,用于跟数据源对接,以获得数据;
  2. Sink:下沉组件,用于往下级agent传递数据或向最终存储系统传递数据
  3. Channel:传输通道组件,用于从source讲数据传递到sink

猜你喜欢

转载自blog.csdn.net/woshuo424479703/article/details/130559930
今日推荐