Hadoop基础总结

一、Hadoop是什么?

  Hadoop是开源的分布式存储和分布式计算平台


二、Hadoop包含两个核心组成:

  1HDFS: 分布式文件系统,存储海量数据

    a、基本概念

      -(block

        HDFS的文件被分成块进行存储,每个块的默认大小64MB

         块是文件存储处理的逻辑单元

      -NameNode

         管理节点,存放文件元数据,包括:

          (1)文件与数据块的映射表

          (2)数据块与数据节点的映射表


      -DataNode

         是HDFS的工作节点,存放数据块

猜你喜欢

转载自www.cnblogs.com/zongfa/p/9230090.html