Spark Master 用Scala实现任务提交 - 代码天地

Spark Master 用Scala实现任务提交

其他 2019-04-12 17:20:35 阅读次数: 0

话不多说，上demo~

test.txt文件里包含了hello world行，读者可自己修改测试、

val inputfile=“file:///home/wangyang/helloSpark.txt” //文件的绝对路径
val conf = new SparkConf().setAppName(“HelloWorld”).setMaster(“spark://IP地址:7077”) //提交的服务器地址
val sc = new SparkContext(conf)
val textfile = sc.textFile(inputfile)
//查询包含hello world的行
val lines = textfile.filter(line => line.contains(“helloworld”))
lines.foreach(println)

HDFS 文件系统

Hadoop之HDFS上测试创建目录、上传、下载文件

1、HDFS上创建目录
${HADOOP_HOME}/bin/hdfs dfs -mkdir /demo1
在这里插入图片描述
2、上传本地文件到HDFS上
${HADOOP_HOME}/bin/hdfs dfs -put ${HADOOP_HOME}/etc/hadoop/core-site.xml /demo1

3、上传本地文件到HDFS上
${HADOOP_HOME}/bin/hdfs dfs -cat /demo1/core-site.xml

4、从HDFS上下载文件到本地
${HADOOP_HOME}/bin/hdfs dfs -get /demo1/core-site.xml

IDEA 打成jar包
在这里插入图片描述
将jar上传至服务器下任意文件夹

将上面Java实现的单词计数打成jar包FirstSpark.jar，并且将jar包上传到Master节点，我是将jar包上传到/opt目录下。
我是以spark-submit的方式完成任务提交。

参考链接：https://www.cnblogs.com/xxbbtt/p/8143593.html
参考链接：https://www.cnblogs.com/zengxiaoliang/p/6508330.html

猜你喜欢

转载自blog.csdn.net/weixin_43127762/article/details/89066246

Spark Master 用Scala实现任务提交

scala里SparkContext 设置spark master url

dolphinscheduler3.1.4提交spark任务--master参数源码解析

Spark中master与worker的进程RPC通信实现

Spark Master启动源码分析

Spark之Master状态转换

【Spark】Spark 容错及 HA--Master 异常

在启动Spark时用start-master.sh和start-slaves出现以下错误:

spark Master启动过程及其master的消息循环机制

Spark Master资源调度--SparkContext向所有master注册

Spark Master资源调度--worker向master注册

spark的start-master.sh（Master 启动脚本）分析

Spark Master High Availability（HA）高可用配置的2种实现

Spark技术内幕：Master基于ZooKeeper的High Availability（HA）源码实现

Spark的启动部分源码解析（org.apache.spark.deploy.master.Master，org.apache.spark.deploy.master.Worker）

Spark源码分析5-Master

启动spark-shell --master yarn的bug

Spark架构原理-Master源码分析

Spark源码解读之Master剖析

Spark:Master原理剖析与源码分析

Spark之Master注册机制

Spark之Master核心调度算法

Spark Master web端口被占用

spark环境安装之单Master

spark-master源码之shuffle

Spark启动流程（Standalone）- master源码

Spark源码剖析——Master、Worker启动流程

Spark Core（十）Spark Master的注册机制

Spark-源码-Spark-StartAll Master Worler启动流程

Spark启动的master参数以及Spark的部署方式

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

面试爱奇艺，竟然挂在第5轮……

scala方法和函数的区别

NYIST--2018大一新生第一次周赛题解

java如何通过client客戶端http实现get/ post请求传递json参数到restful 服务接口

RabbitMQ 队列类型

2018-2019-1 20165311 20165329 20165334 实验一开发环境的熟悉

iOS打包工具配置相应的文件路径一键打包到指定位置

【每日一题】替换空格

【转载】FPGA配置方式

旅行青蛙

每日归档

更多

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)