Apache Flink - 基本API概念 - 代码天地

Apache Flink - 基本API概念

其他 2018-08-05 17:46:45 阅读次数: 0

Flink程序是实现分布式集合转换的常规程序。集合最初是从源创建的。通过接收器(slink)返回结果，接收器可以将数据写到某个文件或stdout。Flink可以在各种环境(context)中运行，本地JVM或集群。

1.数据集和数据流

Flink用特殊的类DataSet and DataStream来表示程序中的数据。可以认为他们是可以包含重复数据的不可变数据集合。在DataSet中数据是有限的，而在DataStream中数据是无限的。
这些集合不同于java里的集合，他们是不可变的，一旦被创造就不能改动，也不能简单的抽查里面的元素。
最初的集合是通过在Flink程序里添加一个源被创造的，新的集合是使用API方法(如map, filter)通过转换得到的。

2.剖析一个Flink程序

每个程序包含相同的基本部分：

获得一个执行环境(execution environment).
加载/创建初始数据。
指定转换这些数据。
指定放置计算结果的位置。
触发程序执行。

StreamExecutionEnvironment是所有Flink程序的基础。可以通过以下静态方法获得：
```
getExecutionEnvironment()

createLocalEnvironment()

createRemoteEnvironment(String host, int port, String... jarFiles)
```
通常只需要使用getExecutionEnvironment()方法,因为这将根据环境做出正确的事：如果你执行你的程序在IDE上或着作为一个普通Java程序，它将创建一个本地环境,将在本地机器上执行程序。如果您从您的程序创建了一个JAR文件，并通过命令行调用它，Flink集群管理者将执行你的main方法并且getExecutionEnvironment()将返回一个在一个集群上执行程序的执行环境。
用于指定数据源，执行环境有几个方法来从文件读取：你可以逐行阅读，像CSV文件，或者使用完全自定义数据输入格式。要读取一个文本文件的顺序,您可以使用:
```
final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

DataStream<String> text = env.readTextFile("file:///path/to/file");
```

猜你喜欢

转载自www.cnblogs.com/ooffff/p/9426407.html

Apache Flink - 基本API概念

Apache Flink应用开发之API基本概念(更新中。。。)

Apache Flink 官方文档--概念

2.3 Apache Flink DataStream API

1.6 Apache Flink 基本概念 — 分布式Runtime

1.5 Apache Flink 基本概念 — 编程模型

Apache Flink简介及概念业务介绍

Apache Flink

2.1 Apache Flink 基本架构

【Flink】idea中flink启动报错org.apache.flink.api.common.ExecutionConfig$GlobalJobParameters

Flink 1.8 Basic API Concepts 基本API概念

Apache Flink-什么是Apache Flink？

Apache Flink：特性、概念、组件栈、架构及原理分析

Apache Flink-编程指南-概念-编程模型

Apache Flink特性、概念、组件栈、架构及原理分析

Apache Flink 零基础入门（一）：基础概念解析

Apache Flink中的各个窗口时间的概念区分

Apache Flink 漫谈系列(13) - Table API 概述

Apache Flink Stream API之State & Fault Tolerance（章节四）

Apache Flink DataStream API之Transformation(章节三)

Apache Flink 零基础入门（三）：DataStream API 编程

如何在 Apache Flink 中使用 Python API？

Apache Flink 零基础入门（四）：DataStream API 编程

Apache Flink 零基础入门（八）：Table API 编程

Exception in thread “main“ org.apache.flink.table.api.NoMatchingTableFactoryException

Flink基本概念

flink编译报错：could not find implicit value for evidence parameter of type org.apache.flink.api.common..

flink Exception in thread “main“ org.apache.flink.api.common.functions.InvalidTypesException:

Flink基本的API

Flink基本API的使用

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)