python利用jupyter连接spark之后如何设置集群资源 - 代码天地

python利用jupyter连接spark之后如何设置集群资源

其他 2020-04-04 18:40:47 阅读次数: 0

jupyter 如何连接spark

jupyter连接spark有两种方式:

第一种: 利用findspark这个包
首先常规的启动jupyter这个服务，然后在python程序里面

import findspark
findspark.init(args) #这个args要指明SPARK_HOME 例如:findspark.init("/usr/local/spark")
from pyspark.sql import SparkSession
sc=SparkSession.builder.appName("new_spark")
										.config("spark.executor.memory","10g")
										.config("spark.executor.cores","8")
										.config("spark.exector.instances","3")
										.getOrCreate()

利用这种方式启动spark会话的时候，集群里面是可以获取得到指定配置的资源

第二种:启动jupyter的时候使用这样的命令:

PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark2

用这种方式启动jupyter的时，依旧运行上述的程序都的时候，会发现在yarn的集群里面并没有申请到这些资源

结论：强烈推荐利用第一种的方式用jupyter

因为利用这样的方式，启动spark的时候可以设置参数获取集群的资源。第二种方式，目前还没有找到方法，让在jupyter里面编辑的spark程序获取得到资源。

善皮之

发布了56 篇原创文章 · 获赞 7 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/OldDirverHelpMe/article/details/97280395

python利用jupyter连接spark之后如何设置集群资源

Spark系列 —— 本地Spark连接远程集群Hive(Scala/Python)

jupyter notebook远程连接设置

Python jupyter lab 设置

利用shell配置spark资源

安装完Python之后，如何设置Python环境变量

spark在windows下使用jupyter设置

为Spark集群配置jupyter notebook的Spark kernel

装了anaconda之后如何设置anaconda、python环境变量

Java连接Spark Standalone集群

集群上如何跑pyspark程序--Running Spark Python Applications

联网设置-spark集群搭建

如何利用Python抓取静态网站及其内部资源

Jupyter与PySpark实现结合spark与python的notebook

spark-yarn查看集群资源

Jupyter如何利用坚果云同步

利用maven的资源提交spark任务

Jupyter | 利用Jupyter用python写opencv的程序

学习之路——Spark(5)<br> Spark 集群资源调度

YARN集群资源如何分配

如何解决jupyter--notebook无法连接python服务也就是显示一直IN[*]

如何使用mobaXterm远程连接jupyter notebook

Jupyter notebook - 如何查询/获取连接Token

IDEA连接Spark集群执行Scala程序

pyspark：连接spark集群Windows环境搭建

python连接mongodb集群

ssh密钥设置-spark集群搭建

在Python 3中设置Jupyter Notebook

如何设置VPN连接

Android应用长连接之后台服务集群开发

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)