hadoop之初窥数据存储与计算 - 代码天地

hadoop之初窥数据存储与计算

其他 2020-03-07 18:17:26 阅读次数: 0

一、hadoop解决的两大问题

解决海量数据的存储
解决海量数据的计算

二、两大问题

　　1.解决海量数据的存储问题

　　由于海量数据在服务器上的存储需要极大的硬件资源，而在某种情况下可能需要对急剧增加的数据进行存储（该种情况可能已经超出了预期的最大内存范围）。而hadoop提供的分布式文件系统在保障数据的可靠性与安全性的前提下可以实现对硬件存储块的扩展。如下：

　　即在客户端要存储数据时，需要向Namenode发送请求，NameNode接收到请求时就会向DataNode进行查询，对内存等信息进行查询；然后NameNode将查询出的数据返回给客户端。如若有足够的存储空间，NameNode会将距离客户端最近的节点存储返回给客户端。在客户端将数据上传到NameNode指定的节点后，该节点会自动向其他节点水平扩散存储备份，从而实现数据的安全性。而在数据的传输中会将该数据分成多个部分进行存储传输从而提高系统的性能。

　　2.解决海量数据的计算问题

　　由于大数据时代的来临，自然大量的数据计算处理便是面对的最大的问题了，而hadoop提出了MapReduce的处理方法。如下：

　　将数据通过分发到不同的服务器上进行并行处理，然后统一返回进行合并计算，并且对计算结果进行校验，如若出现错误则再次部署执行。

猜你喜欢

转载自www.cnblogs.com/withheart1202-never/p/12435894.html

hadoop之初窥数据存储与计算

大数据杂谈之初窥Kafka

Hadoop基础之初识大数据与Hadoop

Hadoop（一）之初识大数据与Hadoop

Python爬虫之初窥Scrapy

大数据学习笔记之初识Hadoop

Python程序设计之初窥门径

C语言之初窥门径

【大数据】大数据Hadoop快速入门之初识

大数据之初步了解HDFS、Hadoop和MapReduce

SpringCloud全面学习笔记之初窥门径篇

hadoop SequenceFile——大数据存储

Hadoop初识及信息安全（大数据的分布式存储和计算平台）

云计算之初识Hadoop——站上山巅看清上山的路

云计算之初感悟

Hadoop学习笔记(9) ——源码初窥

《Hadoop基础教程》之初识Hadoop

hadoop基础之初识Hadoop MapReduce架构

hadoop基础之初识Hadoop hdfs架构

再窥--单链表和顺序存储

Hadoop海量数据存储与计算高可用集群部署（全网最详细，初学者照着也能搭建）

初窥容器和云计算

Hbase存储数据，由于现在的hadoop

hadoop离线数据存储和挖掘架构

计算机存储数据

饮冰三年-人工智能-Python-37 爬虫之初窥门径

论一只爬虫的自我修养11：Scrapy框架之初窥门径

购物车数量加减器（自定义之初窥门径）

基于分布式数据库的存储和hadoop的分布式计算的分布式sql计算方法

Hadoop系列之初识MapReduce（1）

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)