三十七、Flume的安装及测试

上一篇文章我们简单介绍了一下Flume这个框架,本文主要介绍一下Flume的安装及测试,最近这几篇博客内容相对简单一些。关注专栏《破茧成蝶——大数据篇》,查看更多相关的内容~


目录

一、Flume的安装

1.1 下载Flume

1.2 上传解压

1.3 修改配置文件

二、Flume的测试

2.1 环境准备

2.2 创建配置文件

2.3 开启端口、生产数据

2.3.1 开启监听端口

2.3.2 启动端口发送数据


一、Flume的安装

1.1 下载Flume

首先我们需要去官网下载Flume的安装包,点击此处进行下载~我们下载的是1.7.0的版本。

1.2 上传解压

将下载好的tar包上传到指定目录,并解压:

1、解压
tar -zxvf ./apache-flume-1.7.0-bin.tar.gz -C ../modules/

2、切换到解压缩的目录
cd ../modules/

3、修改一下文件名,目的是为了简单点,可以不修改
mv apache-flume-1.7.0-bin flume

1.3 修改配置文件

1、首先需要切换到flume的conf目录下,将flume-env.sh.template文件复制一份,并改名为flume-env.sh

2、在flume-env.sh中添加JAVA_HOME。

二、Flume的测试

上面对Flume进行了安装,下面来简单看一下一个官方的案例吧:监控端口数据。启动Flume监控本机44444端口,通过netcat想本机的44444端口发送数据,Flume将监听到的数据打印在控制台。

2.1 环境准备

1、首先我们得需要使用netstat命令看一下44444端口是否被占用。netstat命令是一个监控TCP/IP网络的非常有用的工具,它可以显示路由表、实际的网络连接以及每一个网络接口设备的状态信息。该命令主要的选项参数如下所示:

1、-t或--tcp:显示TCP传输协议的连线状况; 
2、-u或--udp:显示UDP传输协议的连线状况;
3、-n或--numeric:直接使用ip地址,而不通过域名服务器; 
4、-l或--listening:显示监控中的服务器的Socket; 
5、-p或--programs:显示正在使用Socket的程序识别码(PID)和程序名称。

如果端口未被占用,会显示如下内容:

2、安装netcat工具

yum install -y nc

2.2 创建配置文件

在flume的conf目录下创建flume-netcat-logger.conf文件,并添加如下配置:

# 声明source、channel、sink。其中,a1表示agent的名称,r1表示a1的输入源,k1表示a1的目的地,c1表示a1的缓冲区。
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# 配置source
# 输入类型为netcat端口类型
a1.sources.r1.type = netcat
# 监听的主机名
a1.sources.r1.bind = localhost
# 监听的端口号
a1.sources.r1.port = 44444

# 指定sink类型为logger
a1.sinks.k1.type = logger

# 设置channel为内存模式
a1.channels.c1.type = memory
# 设置channel的总容量为1000个event
a1.channels.c1.capacity = 1000
# 设置channel收集到100条event后再提交事务
a1.channels.c1.transactionCapacity = 100

# 连接source、channel、sink
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

2.3 开启端口、生产数据

2.3.1 开启监听端口

bin/flume-ng agent --conf conf/ --name a1 --conf-file conf/flume-netcat-logger.conf -Dflume.root.logger=INFO,console

其中相关的参数说明如下所示:

1、--conf conf/:表示配置文件存储在conf/目录,--conf也可以使用-c表示。
2、--name a1:表示给agent起名为a1,--name也可以使用-n代替。
3、--conf-file conf/flume-netcat-logger.conf:flume本次启动读取的配置文件是在conf目录下的flume-netcat-logger.conf文件。
4、-Dflume.root.logger==INFO,console:-D表示flume运行时动态修改flume.root.logger参数属性值,并将控制台日志打印级别设置为INFO级别。日志级别包括:log、info、warn、error。

2.3.2 启动端口发送数据

nc localhost 44444

在监听器页面可以看到已经接收到了数据:

好了,本文非常简单,就是安装一下Flume顺便测试一个简单的用例,下篇文章咱们搞几个复杂一点的例子进行试验。你们在这个过程中遇到了什么问题,欢迎留言,让我看看你们遇到了什么问题~

猜你喜欢

转载自blog.csdn.net/gdkyxy2013/article/details/111761541