大数据学习——存储一个50G的文件 - 代码天地

大数据学习——存储一个50G的文件

其他 2019-01-02 21:38:02 阅读次数: 0

#解决海量数据的存储问题
分布式文件系统（HDFS）
1、具有分布式的集群结构我们把这样实际存储数据的节点叫做 datanode
2、具有一个统一对外提供查询存储搜索机器节点
对外跟客户端统一打交道
对内跟实际存储数据的节点打交道
3、具有备份的机制解决了机器挂掉时候数据丢失的问题
4、具有统一的API 对客户端来说不用操心你集群内部的事情只要我调用你的API，
我就可以进行文件的读取存储甚至是搜索
甚至我们希望可以提供一个分布式文件系统的引用 fs= new FileSystem()
fs.add .copy .rm

#解决分布式数据计算（处理）问题

分布式的编程模型（MapReduce）
思想分而治之：先局部再总体
map(映射) reduce(聚合)
整天上作为一个编程模型：需要给用户提供一个友好便捷的使用规范
比如：你要继承什么东西配置什么怎么去调用怎么去执行
1、继承我们的一个mapper 实现自己的业务逻辑
2、继承我们的一个reduce 实现自己的业务逻辑
3、最好可以提供可供用户进行相关配置的类或者配置文件

作为一个分布式计算框架最好我们还提供一个程序的总管（MrAppmater）用来管理这种分布式计算框架的内部问题：启动衔接等等

#解决了分布式系统的资源管理问题
分布式资源管理（yarn）
为了更好的管理我们集群的资源最好设计成分布式的架构
1、需要一个统一对外提供服务的节点（某一机器或者机器上的一个进程一个服务）
叫做资源管理者 ResourceManager
2、需要在集群中的每台机器上有一个角色用来进行每台机器资源的管理汇报
叫做节点管理者 nodemanager

猜你喜欢

转载自www.cnblogs.com/feifeicui/p/10211312.html

大数据学习——存储一个50G的文件

腾讯云团购 18个月 120元,1C2G 1M 50G系统盘云服务器，再送50G对象存储+8元送CN域名

什么是“50G PON”？

吐血整理：50G区块链学习资料全免费，拿走不谢！

27.hadoop系列之50G数据清洗入库秒查询实践

一分钟了解什么是50G光模块

50G光模块在5G中的应用

Python花式读取大文件(10g/50g/1t)遇到的性能问题（面试向）

Python花式读取大文件(10g/50g/1t)遇到的性能问题（面试向）

大数据时代，如何成为一个年薪50w的大数据开发工程师？

零基础学java的最佳学习方法和最全java知识大纲(含50G学习资料)

CSS入门教程视频（50G）

Docker部署迁移 50G满了怎么办

Python中的建立一个文件存储数据

【经典】一个大数据学习的解决方案

【经典】一个大数据学习的解决方案

卜算子·大数据简介一个开源、成体系的大数据学习教程

TiDB一个大数据实时计算的存储利器

大数据互联网时代，如何成为一个年薪50w的大数据开发工程师？

大数据学习——有两个海量日志文件存储在hdfs

虚拟机磁盘分区（20G升50G）

Xilinx参与25G和50G互连性测试大会

【大数据】从0配置一个大数据集群

学习的一个存储过程

一个存储过程学习用

面试- 阿里-. 大数据题目- 给定a、b两个文件，各存放50亿个url，每个url各占64字节，内存限制是4G，让你找出a、b文件共同的url?

2018年最新Spring Boot视频教程附代码笔记资料（50G）

[转]2018年最新Spring Boot视频教程附代码笔记资料（50G）

win10 C盘超过50G？教你如何对C盘瘦身！

VS2017——50G超豪华IDE套餐酸爽体验！

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)