[大数据面试]-- 6.Hadoop 题目 - 代码天地

[大数据面试]-- 6.Hadoop 题目

其他 2020-01-14 10:44:21 阅读次数: 0

============================================================================================

1、集群规模、配置怎样？

2、namenode端口

3、Hadoop的集群管理模式

4、如何更改输出文件的名称

5、Mapereduce是多进程模式、Spark是多线程模式(task用完资源就释放，启动task不费时间)

6、hdfs-default.xml：修改存储阈值的参数

7、MapReduce调优

8、yarn的组件：ResourceManager、NodeManager、Container、ApplicationMaster

9、HDFS文件系统的优缺点

HDFS优点：

数据冗余（多副本存储）、硬件容错
处理流式的数据访问，一次写入多次读取
适合存储大文件
可以构建在廉价机器上，节省成本

HDFS缺点：

不适合低延迟数据访问
无法高效存储大量小文件：因为即便只有1M的文件，也是拥有自己的元数据的。所以如果存在大量的小文件，那么相对应的元数据需要占用的存储空间就越大，元数据过多会给NameNode增加压力

highfei2011 博客专家

发布了508 篇原创文章 · 获赞 613 · 访问量 201万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/high2011/article/details/98522960

[大数据面试]-- 6.Hadoop 题目

大数据面试题目

[大数据面试]-- 5.Flink 题目

[大数据面试]-- 4.Hive 题目

[大数据面试]-- 3.Spark 题目

[大数据面试]-- 2.Scala 题目

[大数据面试]-- 1.Java 题目

hadoop面试题目分享

[转] 大数据比赛题目

【大数据面试】-- 2019年面试和笔试题目汇总

infosys大数据(hadoop)方向电话面试

Hadoop大数据面试题（全）

大数据面试集锦---Hadoop篇

Hadoop大数据面试题（全）

大数据面试题——Hadoop篇

大数据面试系列之——Hadoop

大数据hadoop 面试经典题

面试题目大汇总（算法、数据库、Java、大数据）

大数据面试题—6

6.Hadoop的学习（Hadoop的配置（伪分布式的搭建）-2(ssh登录远程主机，无口令提示)）

ES6高频面试题目整理

大数据面试题(一)----HADOOP 面试题

大数据面试题目第二部分

大数据面试题目第一部分

大数据运维工程师面试题目

大数据面试题目（第一部分）

hadoop题目（一）

上课大数据实验题目

大数据题目集——选择题

大数据分析面试题库—基本大数据Hadoop面试问题

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)