大数据的开发流程:
- 产品人员提需求
- 数据部门搭建数据平台(搭建一个集群),分析数据指标。
- 数据可视化(邮件的展示,邮件的发送,大屏展示)
大数据部门的组织结构:
Hadoop是什么?作用?
狭义:Haloop是一个分布式的系统基础框架
广义:Hallop生态圈。
作用:解决海量数据的存储和分析,计算问题。
Hadoop特点:
高可靠性:多副本
高效性:并行
可容错性:重新分配
可扩展性:修改配置文件
图象理解:
Hadoop的架构分为几部分:
1.x 由HDFS,MapReduce,common
2.x 由HDFS,MapReduce,Yarn,common
区别: 1.xMapReduce做两件事,计算和资源调度
2.x MapReduce做一件事,资源调度由Yarn做
也就是2.x增加Yarn
HDFS(Hadloop Distributed File System)(分布式文件系统)作用:数据存储