随笔--Spark Sql 知识总结 - 代码天地

随笔--Spark Sql 知识总结

其他 2019-03-08 21:31:12 阅读次数: 0

内存列存储（In-Memory Columnar Storage）
摆脱了对hive的依赖性，SparkSQL无论在数据兼容、性能优化、组件扩展方面都得到了极大的方便。
SparkSql特点
1）引入了新的RDD类型SchemaRDD，可以像传统数据库定义表一样来定义SchemaRDD
2）在应用程序中可以混合使用不同来源的数据，如可以将来自HiveQL的数据和来自SQL的数据进行Join操作。
3）内嵌了查询优化框架，在把SQL解析成逻辑执行计划之后，最后变成RDD的计算

parkSQL在下面几点做了优化：
1）内存列存储（In-Memory Columnar Storage）
不存在冗余列问题，避免数据在内存中类型的频繁转换，更高效的压缩算法
基于列存储，每列数据都是同质的，所以可以降低数据类型转换的CPU消耗
每个列创建一个JVM对象，从而可以快速的GC和紧凑的数据存储；

SparkSql将RDD封装成一个DataFrame对象，这个对象类似于关系型数据库中的表。它是个只读的表，不能在运算过程再往里加元素。

val rdd = sc.parallelize(List(1,2,3,4,5,6))
rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:21

 sc.parallelize(List( (1,"beijing"),(2,"shanghai") ) )
 res3: org.apache.spark.rdd.RDD[(Int, String)] = ParallelCollectionRDD[5] at parallelize at <console>:22

猜你喜欢

转载自blog.csdn.net/qq_38973672/article/details/88121118

随笔--Spark Sql 知识总结

Spark SQL重点知识总结

spark sql 总结

Spark SQL 报错总结

Spark SQL 编程总结

SQL 知识总结

mysql sql知识总结

MySQL、Oracle、Sql Server、Hive、Spark SQL、Flink SQL总结

Spark SQL 笔记(18)——spark SQL 总结(1)

Spark Streaming知识总结

Sql 随笔

SQL随笔

SQL相关知识复习总结

Sql知识点总结

Leetcode知识总结——SQL(1)

知识点总结>>>随笔

Spark SQL项目流程分析总结

Spark SQL 笔记(19)——spark SQL 总结(2) DataFrame VS SQL

Spark学习（柒）- Spark SQL扩展和总结

spark知识点总结

Spark SQL

Spark Sql Dsl Sql

spark知识体系04-SQL,DataFrames,DateSets

Spark sql知识点和执行流程图

Sql_Server基础知识总结

SQL进阶知识点总结

SQL基础知识点总结

Sql Sever知识点总结

SQL基础知识归纳总结

SQL___基础知识（练习总结）

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)