大数据入门(Hadoop)

大数据的开发流程:

  1. 产品人员提需求
  2. 数据部门搭建数据平台(搭建一个集群),分析数据指标。
  3. 数据可视化(邮件的展示,邮件的发送,大屏展示)
    大数据部门的组织结构:
    在这里插入图片描述
    Hadoop是什么?作用?
    狭义:Haloop是一个分布式的系统基础框架
    广义:Hallop生态圈。
    作用:解决海量数据的存储和分析,计算问题。

Hadoop特点:
高可靠性:多副本
高效性:并行
可容错性:重新分配
可扩展性:修改配置文件

图象理解:
在这里插入图片描述
Hadoop的架构分为几部分:
1.x 由HDFS,MapReduce,common
2.x 由HDFS,MapReduce,Yarn,common
区别: 1.xMapReduce做两件事,计算和资源调度
2.x MapReduce做一件事,资源调度由Yarn做
也就是2.x增加Yarn
在这里插入图片描述
HDFS(Hadloop Distributed File System)(分布式文件系统)作用:数据存储
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/houzhicongone/article/details/114365562