Hadoop（三）大数据离线计算与实时计算

编程语言 2018-11-20 20:24:42 阅读次数: 0

分享一下我老师大神的人工智能教程吧。零基础，通俗易懂！风趣幽默！http://www.captainbed.net/

也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！

一、大数据离线计算：MapReduce计算模型

1、MapReduce是处理HDFS上的数据

2、MapReduce的思想来源是PageRank（搜索排名），原理是进行分布式计算。

如上图，网页跳转中，访问网页3的次数最多，也就是权重最大的为网页3。比如京东、淘宝中给推荐的商品，就是近期访问的比较多的商品。

MapReduce的思想是把一个大任务拆分成多个小任务，再把小任务的结果汇总，得到最后的结果。

3、数据都是历史数据、数据已经存在（HDFS）

二、大数据实时计算：Apache Storm

1、特点：数据源源不断地产生，不停处理数据

2、例子：自来水厂

3、框架：Apache Storm、Spark Streaming

4、格式：storm jar jar文件任务的类名任务的别名

storm jar storm-starter-topologies-1.0.3.jar.jar org.apache.storm.starter.WordCountTopology MyWC

三、搭建Hadoop的Eclipse开发环境（不推荐）

1、配置Hadoop Home

2、hadoop.dll复制到c:\windows\system32

3、配置环境变量

HADOOP_HOME

%HADOOP_HOME%/bin配置到PATH里

4、推荐：MRUnit（MapReduce Unit），类似Junit

小结

对Hadoop的认识只停留在理论上，更多的操作在精力和时间的允许下有待实践。

给我老师的人工智能教程打call！http://www.captainbed.net/

这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_43725037/article/details/84298024

Hadoop（三）大数据离线计算与实时计算

hadoop离线计算与 storm实时计算

离线计算与实时计算

公司招聘大数据开发工程师（离线计算、实时计算）

大数据实时计算框架

大数据的实时计算与离线数据统计整理学习

Storm流式实时计算开源框架（三）

《离线和实时大数据开发实战》（三）Hadoop原理实战

实时计算的最佳实践：基于表格存储和Blink的大数据实时计算

【Hadoop】(三) Hadoop计算框架 MapReduce

大数据离线计算Hadoop2.x 学习笔记（3）- HDFS写入分析和 MR

在hadoop或docker环境下基于kafka和flink的实时计算大屏展示

大数据实时计算框架：SparkStreaming

Storm 实战：构建大数据实时计算

基于Storm与Cassandra的实时计算与大数据实践

Flink大数据实时计算系统实践

大数据“重磅炸弹”：实时计算框架 Flink

揭秘大众点评的大数据实时计算

.NET 大数据实时计算--学习笔记

大数据面试题_实时计算部分

大数据实时计算框架-实例

大数据Flink实时计算技术

离线计算,实时计算和流式计算的概念区分

大数据时代之hadoop(一)：hadoop安装大数据时代之hadoop(二)：hadoop脚本解析大数据时代之hadoop(三)：hadoop数据流（生命周期）大数据时代之hadoop(四)：hadoop 分布式文件系统（HDFS) 大数据时代之hadoop(五)：hadoop 分布式计算框架（MapReduce）

大数据计算架构Hadoop、Spark和Storm 三者技术比较

大数据云计算 hadoop的概念理解

大数据-hadoop-MapReduce计算流程

大数据云计算——hadoop组件

大数据计算框架实例：Hadoop

大数据大牛，终于用37部分讲完了Hadoop体系之离线计算，共17.97G

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)