Spark SQL加载数据和保存数据通用方式 - 代码天地

Spark SQL加载数据和保存数据通用方式

其他 2021-03-28 22:32:07 阅读次数: 0

加载数据

spark.read.format("…")[.option("…")].load("…")

format("…")：指定加载的数据类型，包括"csv"、“jdbc”、“json”、“orc”、“parquet"和"textFile”。
load("…")：在"csv"、“jdbc”、“json”、“orc”、"parquet"和"textFile"格式下需要传入加载数据的路径。默认加载的是parquet类型的文件。
option("…")：在"jdbc"格式下需要传入JDBC相应参数，url、user、password和dbtable。

df.write.save("D:\\develop\\workspace\\bigdata2021\\spark2021\\out")

保存数据

df.write.format("…").mode("...")[.option("…")].save("…")

format、option参数同上。
save：指定存储路径。默认是snappy压缩的parquet文件存储格式。
mode：用来指明如何处理数据。默认error，如果文件存在就抛出异常；append如果文件存在则追加；overwrite如果文件存在就覆盖；ignore如果文件存在就忽略。

// 默认保存
df.write.save("D:\\develop\\workspace\\bigdata2021\\spark2021\\out")

// 使用format保存指定格式的文件
df.write.format("json").save("D:\\develop\\workspace\\bigdata2021\\spark2021\\out")

// mode指定保存选项  
df.write.format("json").mode("append").save("D:\\develop\\workspace\\bigdata2021\\spark2021\\out")

df.write.format("json").mode("overwrite").save("D:\\develop\\workspace\\bigdata2021\\spark2021\\out")

猜你喜欢

转载自blog.csdn.net/FlatTiger/article/details/115284467

Spark SQL加载数据和保存数据通用方式

Spark 数据的加载和保存

Spark SQL 的数据加载与保存(load , save)

第61课：Spark SQL数据加载和保存内幕深度解密实战

Spark—数据读取和保存

spark 数据的加载和保存（Parquet、JSON、CSV、MySql）

Spark SQL从MySQL中加载数据以及将数据写入到mysql中 Spark Shell方式 Spark SQL程序

Spark——数据读取与保存

spark sql 读取数据库并保存

spark笔记-spark sql

大数据-Spark SQL

spark DataFrame 读写和保存数据

Spark九读取和保存数据之Spark SQL的结构化数据，数据库和键值对存储

Spark -- Spark SQL 简介数据抽象

Spark（五）数据读取与保存

Spark-SQL从MySQL中加载数据以及将数据写入到mysql中（Spark Shell方式，Spark SQL程序

Spark SQL

Hive on Spark 与Spark SQL比较

Spark之spark.sql

Spark 04 Spark SQL 使用

Spark 03 Spark SQL 概述

Spark基础：（六）Spark SQL

spark基础六 spark SQL

Spark-Spark SQL and DataFrame

Spark SQL与Hive on Spark的比较

Spark学习之Spark SQL

Spark学习笔记：Spark SQL

spark笔记之Spark SQL

Spark -- Spark SQL初体验

【Spark】Spark Web UI - SQL

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)