Spark 2.4.5 DataFrame 调优

其他 2020-05-17 23:03:58 阅读次数: 0

在内存中缓存数据

Spark SQL可以通过调用Spark .catalog. cachetable(“tableName”)或datafame .cache()来使用内存中的列格式缓存表。
Spark SQL将只扫描所需的列，并自动调整压缩，以最小化内存使用和GC压力。
调用spark.catalog.uncacheTable(“tableName”)来从内存中删除该表。
可以使用SparkSession上的setConf方法或使用SQL运行SET key=value命令来配置内存缓存。

　　

调优参数

还可以使用以下选项来调优查询执行的性能。在将来的版本中，随着自动执行更多的优化，这些选项可能会被弃用。

　　

猜你喜欢

转载自www.cnblogs.com/yjyyjy/p/12907463.html

Spark 2.4.5 DataFrame 调优

spark-2.4.5 安装记录

spark2.4.5搭建过程

Spark调优 | Spark Streaming 调优

2.4.5

spark 调优概述

Spark参数调优

spark性能调优

Spark 调优

Spark的性能调优

Spark shuffle调优

Spark调优详解

Spark调优秘诀

Spark的资源调优

[Spark]-调优

spark shuffle的调优

Spark调优总结

Spark调优

spark调优4

spark调优3

spark调优2

spark调优1

spark调优综述

13.1 Spark调优

Hive on Spark调优

spark算子调优

Spark 配置调优

spark 参数调优

spark调优总览

spark资源调优

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)