Spark Streaming连接Flume的两种方式 - 代码天地

Spark Streaming连接Flume的两种方式

编程语言 2018-12-26 15:51:33 阅读次数: 0

Spark提供了两种不同的接收器来接受Flume端发送的数据。
   推式接收器该接收器以 Avro 数据池的方式工作，由 Flume 向其中推数据。设置起来非常简单，我们只需要将Fluem简单配置下，将数据发送到Avro数据池中，然后scala提供的FlumeUtils代理对象会把接收器配置在一个特定的工作节点的主机名和端口上。当然，这些配置需要和Flume保持一致。
   虽然这种方式很简洁，但缺点是没有事务支持。这会增加运行接收器的工作节点发生错误时丢失少量数据的几率。不仅如此，如果运行接收器的工作节点发生故障，系统会尝试从另一个位置启动接收器，这时需要重新配置 Flume 才能将数据发给新的工作节点。这样配置会比较麻烦。
   拉式接收器该接收器设置了一个专门的Flume数据池供Spark Streaming拉取数据，并让接收器主动从数据池中拉取数据。这种方式的优点在于弹性较好，Spark Streaming通过事务从数据池中读取并复制数据。在收到事务完成的通知前，这些数据还保留在数据池中。当你把自定义 Flume 数据池添加到一个节点上之后，就需要配置 Flume 来把数据推送到这个数据池中，

a1.sinks = spark
a1.sinks.spark.type = org.apache.spark.streaming.flume.sink.SparkSink
a1.sinks.spark.hostname = receiver-hostname
a1.sinks.spark.port = port-used-for-sync-not-spark-port
a1.sinks.spark.channel = memoryChannel

等到数据已经在数据池中缓存起来，就可以调用 FlumeUtils 来读取数据了

猜你喜欢

转载自blog.csdn.net/xiaozhaoshigedasb/article/details/85260146

Spark Streaming连接Flume的两种方式

Spark Streaming 两种方式连接 Flume

Spark Streaming整合Flume的两种方式

spark-streaming-连接kafka的两种方式

Spark Streaming | 连接Kafka的两种方式

Spark Streaming连接Kafka的两种方式 direct 跟receiver 方式接收数据的区别

Spark Streaming集成Kafka的两种方式

Spark Streaming 读取 Kafka 数据的两种方式

Spark Streaming整合Kafka的两种方式

spark-streaming获取kafka数据的两种方式

spark-streaming对接kafka的两种方式

spark streaming 消费kafka两种方式的对比

Spark-streaming kafka数据接收两种方式

spark连接hive的两种方式

Flume对接Spark Streaming的2种方式

Spark-Streaming获取kafka数据的两种方式-Receiver与Direct的方式

Spark Streaming 结合 Kafka 两种不同的数据接收方式比较

Spark-streaming kafka数据接收两种方式对比

Spark-Streaming获取kafka数据的两种方式：Receiver与Direct

工具篇-Spark-Streaming获取kafka数据的两种方式（转载）

spark streaming 接收kafka消息之一 -- 两种接收方式

spark streaming整合kafka的两种机制比较分析

Spark Streaming消费Kafka数据的两种方案

spark消费kafka的两种方式

spark创建DF的两种方式

Spark WordCount的两种方式

Spark创建DataFream的两种方式

flume 对接spark streaming

Spark Streaming——Flume实例

Spark Streaming整合Flume

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)