Spark Streaming-02

编程语言 2018-05-06 20:14:47 阅读次数: 3

直接上代码，注意textFileStream数据源没有 receiver

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}

object TextFileStreamWordCountApp {
  def main(args: Array[String]){
    val sparkConf = new SparkConf().setAppName("

TextFileStreamWordCountApp").setMaster("local[2]")

val ssc = new StreamingContext(sparkConf, Seconds( 10)) val lines = ssc.textFileStream( "C: \\ wc") //val lines = ssc.socketTextStream("hadoop",9999) lines.flatMap(_.split( ",")).map((_, 1)).reduceByKey(_+_).print ssc.start() ssc.awaitTermination() }}

SparkStreaming关键性方法：

1、transform 将RDD转化为Dstream

2、updateStateByKey 对批处理结果进行累计

Output Operations on DSstream

1、saveAsTextFiles 会导致小文件过多

2、saveAsHadoopFiles

3、foreachRDD（写入到关系型数据库中，必须用到的方法）

猜你喜欢

转载自blog.csdn.net/qq_15300683/article/details/80215667

Spark Streaming-02

Spark: Spark Streaming

Spark------Spark Streaming

[Spark]-Spark streaming

【SPARK】Spark Streaming简介

Spark Streaming

[Spark][spark_streaming]#5_spark_streaming&spark_sql

spark学习笔记：Spark Streaming

Spark学习之Spark Streaming

Spark学习笔记： Spark Streaming

Spark --------Spark Streaming 集成 Kafka

【Spark】Spark Streaming的back pressure

Spark入门(五)——Spark Streaming

Spark核心之Spark Streaming

spark--Spark Streaming实战-★★★★★

spark--Spark Streaming原理-★★★

spark--Spark Streaming引入-★

【Spark Streaming】3、Spark Streaming入门

Spark Streaming & Structured Streaming分析

flume 对接spark streaming

Spark Streaming简介

Spark Streaming Programming Guide

Spark Streaming 读取RabbitMQ

Storm与Spark Streaming比较

【Spark Streaming介绍】

spark Streaming详解

Spark Streaming的窗口操作

Spark Streaming与Storm的对比

storm,spark streaming and flink

Spark Streaming入门

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)