Spark技术优势总结 - 代码天地

Spark技术优势总结

其他 2018-07-27 11:25:47 阅读次数: 0

优秀的数据批处理框架：作业任务在进行MapReduce数据批处理时，作业任务需要读取HDFS文件作为数据输入进行聚合，而统计输出的结果也要存储到HDFS上。如果是一次数据处理需要运行多个MapReduce作业，其中间结果通过HDFS保存与传递，如果是多次HDFS读写操作，会产生I/O读写效率低和处理时间长的瓶颈。但是，如果采用Spark进行数据批处理时，替代多个MapReduce作业任务的是一个Spark作业程序，不仅可以缩短作业的申请、资源分配过程，而且把作业执行时的中间结果可保存于内存中，减少HDFS的读写次数，从而减少了磁盘读写开销，大幅缩短数据处理时间，提高了数据处理效率。
高可扩展的编程接口：相比MapReduce编程模型，Spark提供了更为灵活的DAG编程模型。DAG编程模型不仅包含了map、reduce接口，还增加了filter、flatMap、union等操作接口，使得编写Spark程序更为方便。Spark提供了编程语言Java、Scala、Python、R的API，以及SQL的支持，支持开发者编写Spark程序。同时还提供了Spark Shell以支持用户进行交互式编程。
多源异构数据处理：Spark支持数据批处理，还支持流式数据处理、复杂分析（包括机器学习、图计算）、交互式数据查询（包括SQL）。Spark可以运行，或者在Hadoop Yarn集群管理器，兼容Hadoop已有的各种数据类型，支持多种数据源，如HDFS、Hive、HBase、Parquet等。

猜你喜欢

转载自blog.csdn.net/peter_changyb/article/details/81190017

Spark技术优势总结

区块链技术优势有什么？

车架号识别技术优势

LikeLib侧链技术优势

区块链侧链技术优势

NB-IoT技术优势及特点

5G技术优势

应用开发，容器技术优势在哪?

区块链技术优势和应用

浅析神鹰TDM和LIMS的技术优势

条形码 - 技术优势与分类介绍

混合多云为何具有技术优势

数据中台：Snowflake的独特技术优势

跨端管理小程序技术优势

无人机杂谈（一）——技术优势是否真的能够转化为商业优势？

无人机杂谈（一）——技术优势是否真的能够转化为商业优势？

面对新语言和跳槽，程序员如何保持技术优势？

半监督主动式机器学习的技术优势：银行金融风控场景分析

深圳源中瑞币币交易系统开发的技术优势

LikeLib:区块链技术优势可以解决云计算发展瓶颈

利用技术优势海外高频交易巨头在华占据制高点

新型时序数据库TimelineDB在风电监控应用中的技术优势

NB-IoT技术优势及其与GPS定位的综合应用

网络视频会议的定义？网络视频会议功能技术优势

OPPO研发芯片，希望依靠核心技术优势与小米争夺欧洲市场

区块链具有诸多技术优势在国外基础教育中的应用案例

柔宇科技超低温非硅制程集成技术优势是什么？

零知识证明| 什么是ZK-STARK以及有哪些技术优势？

虚拟酒店全景制作_虚拟现实技术优势_华锐互动

据+AI赋能教育智能化转型，华为云技术优势明显！

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)