作者：禅与计算机程序设计艺术

1.前言

Apache Flink 和 Apache Kafka 是构建可靠、高吞吐量和低延迟的数据管道（data pipeline）的两个著名的开源项目。2019年4月，两者宣布合作共赢。在这次合作中，Apache Kafka 将提供强大的消息存储能力、Flink 将作为一个分布式数据流处理平台来对其进行实时计算和分析。Apache Kafka 在设计之初就考虑到大规模数据的实时处理，它支持多种协议，如 AMQP、Apache Pulsar、Google Pub/Sub、Amazon Kinesis Data Streams 等。Apache Flink 支持基于 Apache Hadoop 的 MapReduce 框架中的计算模型，并且引入了批处理、窗口函数等特性，以支持更复杂的实时应用场景。因此，两者可以有效地结合起来，构建出一个强大的生态系统。

在本篇文章中，我将阐述 Apache Flink 和 Apache Kafka 两者之间的集成架构，以及如何在实际应用中利用它们。文章主要内容如下：

Apache Flink 简介
Apache Kafka 简介
Apache Flink + Apache Kafka 集成架构概览
数据源的发布-订阅模式
流处理的有状态机制
配置参数和运行指南
Apache Flink 与 Apache Kafka 的数据通信协议
数据集成实践及心得总结

文章假定读者已经熟悉 Apache Flink 和 Apache Kafka，并具备一些使用经验。

Apache Flink 和 Apache Kafka 两者之间的集成架构 Flink and Apache Kafka: A Winning Partnership

1.前言

2.基本概念术语说明

2.1 Apache Flin

猜你喜欢