大数据学习笔记之kafka----分布式消息发布/订阅系统

其他 2020-02-16 10:47:54 阅读次数: 0

一、kafka简介

kafka是Linkedin于2012年12月份开源的消息系统

kafka是一个分布式的，基于发布/订阅的消息系统；

kafka：一个队列平台，不仅支持离线，还支持在线

特点：

--消息持久化：通过O(1)的磁盘数据结构提供数据的持久化；针对磁盘存储做了大量的优化，提高了磁盘存储的效率；主要针对了操作系统的特性来进行优化：预读、后写：针对磁盘的顺序访问，优化了写磁盘的机制，降低了写磁盘的次数，提高了写磁盘的速率
--高吞吐量：每秒百万级的消息读写
--分布式：扩展能力强
--多客户端支持：java、php、python、C++......
--实时性:生产者生产的message立即被消费者可见；其中message为kafa的数据单位

二、kafka基本组件

broker：每一台机器叫一个broker
producer：日志消息生产者，用来写数据；
consumer：消息的消费者，用来读数据，可以订阅一个或者多个话题，从broker拉数据，从而消费这些已发布的消息；
topic：不同消费者去指定的topic中读，不同的生产者往不同的topic中写；topic就类似于一个话题，是一个逻辑概念；然后话题的发布者（producer）可以有很多的粉丝（consumer），然后consumer可以订阅producer生产的topic；producer和consumer之间可以有多个topic；
partition：在topic基础上做了进一步的区分分层；是topic的物理实现

从上图可以看出，生产者将数据发送给Broker代理，Broker代理有多个话题topic，消费者从Broker获取数据。

kafka使用场景

日志收集：公司可以用kafka手机各种服务器的log，通过kafka以统一的接口服务的方式开发给各种consumer，例如Hadoop、Hbase、Solr等

消息系统：解耦生产者和消费者，魂村消息等

用户活动跟踪：kafka经常被用来记录web用户或者app用户的各种活动，如浏览网页，搜索，点击等活动，这些活动信息被各个服务器发布到kafka的topic中，然后订阅者通过订阅这些topic来做实时的监控分析，或者装载到hadoop，数据仓库中做离线分析和挖掘

运营指标：kafka也经常用来记录运营监控数据，包括收集各种分布式应用的数据，生产各种操作的集中反馈，比如报警和报告。

流式处理：比如spark streaming和storm

WRichards

发布了14 篇原创文章 · 获赞 15 · 访问量 4002

私信关注

猜你喜欢

转载自blog.csdn.net/wsq_zqfl/article/details/83995231

大数据学习笔记之kafka----分布式消息发布/订阅系统

大数据系列之分布式发布订阅消息系统Kafka（三）Kafka的JAVA API

大数据系列之分布式发布订阅消息系统Kafka（一）Kafka简介，组成，集群安装

大数据系列之分布式发布订阅消息系统Kafka（二）Kafka的基本操作，工作流程

分布式发布订阅消息系统 Kafka

Kafka分布式消息发布和订阅系统简介

分布式发布订阅消息系统Kafka

【新星计划】Kafka分布式发布订阅消息系统

分布式发布订阅消息系统 Kafka 架构设计（翻译自kafka.apache）

大数据——kafka(分布式消息系统)

Apache Kafka 2.0.0 正式发布，分布式消息发布订阅系统

Apache Kafka 2.3.1 发布，分布式消息发布订阅系统

Apache Kafka 2.5.1 发布，分布式消息发布订阅系统

Apache Kafka 2.6.1 发布，分布式消息发布订阅系统

Zookeeper搭载kafka分布式消息发布/订阅

分布式通信方式之消息发布订阅之Kafka

分布式发布订阅消息系统 Kafka 架构设计

高吞吐量的分布式发布订阅消息系统Kafka

Kafka-API中间件MQ消息队列在Maven项目中的配置使用操作 (分布式发布订阅消息系统)

Hadoop学习笔记：分布式消息队列 Kafka

Kafka分布式消息系统

分布式消息系统 Kafka 简介

Apache Kafka 分布式消息系统

分布式消息系统Kafka初步

分布式消息系统Kafka简介

分布式消息系统：Kafka

Kafka 分布式消息系统

分布式的消息系统Kafka

什么是Kafka——分布式消息系统

kafka——分布式的消息队列系统

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)