大数据入门 | 二、初识hadoop

网易云课堂《大数据技术原理与应用》课程Chapter 2学习笔记


01 

Hadoop是什么?

Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。它是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中。

Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce。它被公认为行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力

几乎所有主流厂商都围绕Hadoop提供开发工具、开源软件、商业化工具和技术服务,如谷歌、雅虎、微软、思科、淘宝等,都支持Hadoop。

02 

Hadoop的特性

Hadoop是一个能够对大量数据进行分布式处理的软件框架,并且是以一种可靠、高效、可伸缩的方式进行处理的,它具有以下几个方面的特性:

•   高可靠性

•   高效性

•   高可扩展性

•   高容错性

•   成本低

•   运行在Linux平台上

扫描二维码关注公众号,回复: 5192417 查看本文章

•   支持多种编程语言

03

Hadoop在企业中的应用

6778119-a7e4468dbd16c969.png
Hadoop在企业中的应用框架

04 

Hadoop生态圈

6778119-4b126e8b17feee2f.png
Hadoop生态圈
6778119-eb36ab94e629dd9f.png
Hadoop生态圈

猜你喜欢

转载自blog.csdn.net/weixin_33871366/article/details/87094022