实时流处理 - 代码天地

实时流处理

其他 2020-01-22 09:07:15 阅读次数: 0

1 目录结构

业务现状分析
实时流处理产生背景
实时流处理概述
离线计算与实时计算对比
实时流处理框架对比
实时流处理架构与技术选型
实时流处理在企业中的应用

2 业务现状分析

需求：
统计主站每个（指定）课程访问的客户端、地域信息分布

地域：ip转换（Spark SQL项目实战）
客户端：（useragent获取 Hadoop基础课程）

如上两个操作：采用离线（Spark/MapReduce）的方式进行统计

实现步骤：
课程编号、ip信息、useragent
进行相应的统计分析操作：MapReduce/Spark

项目架构：

日志收集：Flume
离线分析：MapReduce/Spark
统计结果图形化展示：Echarts

问题：

小时级别
10分钟
5分钟
1分钟
秒级别

如何解决？实时流处理框架

3 实时流处理产生背景

时效性高
数据量大

4 实时流处理概述

实时计算
流式计算
实时流式计算

5 离线计算与实时计算对比

数据来源：

离线：HDFS 历史数据数据量比较大
实时：消息队列（Kafka），实时新增/修改记录过来的某一笔数据

处理过程：

离线：MapReduce： map + reduce
实时：Spark（DStream/SS）

处理速度：

离线：慢
实时：快速

从进程的角度：

离线：启动+销毁
实时：7*24h

6 实时流处理框架对比

Apache Strom
Apache Spark Streaming
IBM Stream
Yahoo！S4
LinkedIn Kafka

7 实时流处理架构与技术选型

8 实时流处理在企业中的应用

电信行业
电商行业

dmxjhg

发布了101 篇原创文章 · 获赞 26 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/liujh_990807/article/details/103747604

sparkStreaming实时处理

七．实时处理多点

Spark Streaming实时流处理笔记（2）—— 实时处理介绍

Storm实时处理方案架构

storm实时处理核心类

大数据实时处理实战

Python实时处理log文件脚本

关于rospy中图像的实时处理

Spark Streaming实时处理应用

大数据的实时处理STORM简介

SparkStreaming 数据实时处理

Spark 实时处理总文章

ＵＳＢ获取图像实时处理

Spark Streaming实时处理Kafka数据

Flink实时处理流数据控制台报错：JobExecutionException: Job execution failed.

【Flutter】包管理（16）Flutter 流处理深入理解和应用 Stream Transform 包实时处理数据

流式大数据实时处理—技术、平台及应用

STORM实时处理框架之安装准备

简述大数据实时处理框架

hadoop（十三）storm流式计算（实时处理）

分布式实时处理系统

分布式实时处理系统Hurricane的架构

Android相机开发: 高效实时处理预览帧数据

Apache Kafka：大数据的实时处理时代

如何用 Hook 实时处理和保存 Ajax 数据

为什么选择 Flink 做实时处理

storm实时处理视频从入门到精通

Flink实时处理的第一个程序

C++实时处理不断被写入的文件

【Python】Python-OpenCV实时处理视频

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)