Flink On Yarn开发程序部署的两种方式详解

其他 2021-03-04 11:18:52 阅读次数: 0

1- 首先编写一个参数传递的Flink的WordCount代码

import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.api.java.utils.ParameterTool;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;

/**
 * @author liu a fu
 * @version 1.0
 * @date 2021/3/3 0003
 * @DESC  使用Flink 计算引擎实现流式数据处理：从Socket接收数据，实时进行词频统计WordCount 参数传递
 *
 */
public class WordCount {
    
    
    public static void main(String[] args) throws Exception {
    
    
        //使用工具类，解析程序运行传递参数
        ParameterTool parameterTool = ParameterTool.fromArgs(args);
        if (2 != parameterTool.getNumberOfParameters()){
    
    
            System.out.println("Usage: WordCount --host <host> --port <port> .............");
            System.exit(-1);
        }

        final String host = parameterTool.get("host");
        final int port = parameterTool.getInt("port");

        //1-流处理环境准备  StreamExecutionEnvironment
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        //2-读取流试数据 source
        DataStreamSource<String> inputDataStream = env.socketTextStream("node1.itcast.cn", 9999);

        //3-数据的转换 transformation
        /*
			step1. 将每行数据按照分割符分割为单词
				spark spark flink  ->  spark, spark, flink
			step2. 将每个单词转换为二元组，表示每个单词出现一次
				spark, spark, flink ->  (spark, 1),  (spark, 1), (flink, 1)
			step3. 按照单词分组，将同组中次数进行累加sum
				(spark, 1),  (spark, 1), (flink, 1) -> (spark, 1 + 1 = 2) , (flink, 1 = 1)
		 */
        //TODO: 3-1 将每行数据按照指定的分割符号切割
        SingleOutputStreamOperator<String> wordDataStream = inputDataStream.flatMap(new FlatMapFunction<String, String>() {
    
    
            @Override
            public void flatMap(String line, Collector<String> out) throws Exception {
    
    
                for (String word: line.trim().split("\\s+")){
    
    
                    out.collect(word);
                }
            }
        });

        //TODO: 3-2 将每行数据准换为 二元元组
        SingleOutputStreamOperator<Tuple2<String, Integer>> tupleDataStream = wordDataStream.map(new MapFunction<String, Tuple2<String, Integer>>() {
    
    
            @Override
            public Tuple2<String, Integer> map(String words) throws Exception {
    
    
                return Tuple2.of(words, 1);
            }
        });

        //TODO: 3-3 将每个单词按照 同组中的 sum进行累加
        SingleOutputStreamOperator<Tuple2<String, Integer>> resultDataStream = tupleDataStream
                .keyBy(0).sum(1);

        //4- 数据终端 sink
        resultDataStream.print();

        //5- 触发执行器 execute
        env.execute(WordCount.class.getSimpleName());
    }
}

将上述程序打好jar包,打好Jar包删除log4j文件
在这里插入图片描述

2. 第一种方式命令方式提交

此方式提交Flink应用可以运行至Standalone集群和YARN集群（Session会话模式和Job分离模式），此处以运行YARN的Job分离模式为例演示提交Flink应用程序。

1: 上传打好的Jar包
cd /export/server/flink/
rz

在这里插入图片描述


2: 提交运行: 
bin/flink run --class cn.itcast.stream.WordCount \
-m yarn-cluster -yjm 1024 -ytm 1024 \
flink-day01-1.0.0.jar --host node1.itcast.cn --port 9999

--class  后面跟全类名
flink-day01-1.0.0.jar  jar包的名字

在这里插入图片描述

模拟socket发送通信:
在这里插入图片描述

结果:

3. 第二种方式UI界面提交

此种方式提交应用，仅仅在Flink Standalone集群和YARN Session会话模式下，此处以YARNSession为例演示。

1: 开启hadoop集群: start-all.sh
2: 启动YARN Session
cd /export/server/flink/

bin/yarn-session.sh -tm 1024 -jm 1024 -s 1 -d

3: 通过Yarn的webUI访问Spark任务的WEBUI
在这里插入图片描述

4: 上传Jar包:

5: 填写参数:

猜你喜欢

转载自blog.csdn.net/m0_49834705/article/details/114335423

Flink On Yarn开发程序部署的两种方式详解

Flink on Yarn的两种运行方式

flink yarn-session的两种使用方式

第 5 节 Flink on yarn的两种方式

flink on yarn模式下两种提交job方式 flink on yarn模式下两种提交job方式

Flink on Yarn两种运行模式详解

Flink on Yarn的两种模式及HA

Flink笔记(三)：Flink 提交任务的两种方式

flink读写MySQL的两种方式

flink提交任务的两种方式

Flink on yarn

flink学习笔记-flink on yarn的两种模式都学会了吗？

Flink on yarn应用部署

flink on yarn部署

flink yarn 部署指南

flink on yarn 部署

【Flink】Flink on yarn 远程调试

flink部署

Flink1.11.0 flink on yarn 模式部署详解

flink开发实战之 flink on yarn

大数据Flink（五十八）：Flink on Yarn的三种部署方式介绍

大数据Flink（五十九）：Flink on Yarn的三种部署方式介绍以及注意

【Flink】Flink 部署性能优化

flink on yarn模式下两种提交job方式 hadoop 完全分布式集群搭建

Flink输出到Kafka(两种方式)

Flink应用案例统计实现TopN的两种方式

Flink:Flink-SQL开发

Flink的部署方式概述

flink on yarn 集群环境部署

Flink部署及作业提交（On YARN）

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)