sparkstreaming直连kafka（0.10版本） - 代码天地

sparkstreaming直连kafka（0.10版本）

其他 2018-10-09 23:02:47 阅读次数: 0

sparkstreaming直连kafka0.10，将偏移量保存在kafka当中，当然也可以根据自己的需要保存到其他地方，话不多说直接上代码：

object DirectStream {

  def main(args: Array[String]): Unit = {

    val group = "g0011"
    val topic = "my-topic666"
    //创建SparkConf，如果将任务提交到集群中，那么要去掉.setMaster("local[2]")
    val conf = new SparkConf().setAppName("DirectStream").setMaster("local[2]")
    //创建一个StreamingContext，其里面包含了一个SparkContext
    val streamingContext = new StreamingContext(conf, Seconds(5));

    //配置kafka的参数
    val kafkaParams = Map[String, Object](
      "bootstrap.servers" -> "master:9092,slave1:9092,slave2:9092",
      "key.deserializer" -> classOf[StringDeserializer],
      "value.deserializer" -> classOf[StringDeserializer],
      "group.id" -> group,
      "auto.offset.reset" -> "earliest", // lastest
      "enable.auto.commit" -> (false: java.lang.Boolean)
    )

    val topics = Array(topic)
    //在Kafka中记录读取偏移量
    val stream = KafkaUtils.createDirectStream[String, String](
      streamingContext,
      //位置策略
      PreferConsistent,
      //订阅的策略
      Subscribe[String, String](topics, kafkaParams)
    )


    //迭代DStream中的RDD，将每一个时间点对于的RDD拿出来
    stream.foreachRDD { rdd =>
      //获取该RDD对于的偏移量
      val offsetRanges = rdd.asInstanceOf[HasOffsetRanges].offsetRanges
      //拿出对于的数据，foreach是一个aciton
      rdd.foreach { line =>
        println(line.key() + " " + line.value())
      }
      //更新偏移量
      // some time later, after outputs have completed(将偏移量更新【Kafka】)
      stream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)
    }

    streamingContext.start()
    streamingContext.awaitTermination()
  }
}

猜你喜欢

转载自blog.csdn.net/CSDN_Hzx/article/details/82692869

sparkstreaming直连kafka（0.10版本）

java集成kafka 0.10版本

大数据学习之路97-kafka直连方式（spark streaming 整合kafka 0.10版本）

0.10版本后的kafka配置producer和comsumer的server参数

消息中间件kafka（0.9以及0.10版本）学习及实践

Libuv从0.10版本迁移到1.0版本的API变动

SparkStreaming与kafka通过直连方式读取数据

SparkStreaming整合kafka直连模式direct方式

kafka0.10版本spark只能读到一个分区的数据，错误Beginning offset xxx is the same as ending offset

kafka 10版本与11版本的区别

kafka初探版本0.10 java编程

kafka-0-8结合sparkstreaming直连方式

Kafka 1.0版本发布

Kafka集群安装--0.8版本

Kafka| Kafka配置说明(0.9.0及0.10.0版本)

【kafka】Apache Kafka 0.11版本新功能简介

ThingsBoard 3.1.1版本在window本地运行之设备直连(二)

springboot 2.2.0版本整合 Kafka 版本对应问题

kafka 0.9版本堆外内存溢出

Kafka 0.8.2.1版本之后Release Note重点

番茄日志发布1.0.3版本-增加Kafka支持

Kafka面试题2020版本

flink对接kafka 1.7.0版本flink

Kafka3.0.0版本——集群启动停止脚本

Centos7 搭建kafka集群（3.0版本）

【kafka】kafka 0.10以及1.x版本的kafka topic 分区扩容

【Kafka】Kafka 0.10.0版本获取Kafka每个分区最新Offset的几种方法

【Kafka】Kafka 0.10.0版本获取Kafka每个分区最新Offset的几种方法

【kafka专栏】不用zookeeper怎么安装kafka集群-最新kafka3.0版本

使用sparkStreaming与Kafka直连方式WordCount,使用redis存放中间结果

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)