Kafka之海量数据处理 - 代码天地

Kafka之海量数据处理

企业开发 2018-05-12 21:34:03 阅读次数: 0

Linkedln作为最近最热的社交网站，受到了与会者们的重点关注。开源的Kafka是Linkedln的开源消息队列——包括数据跟踪、记录、指标、消息和队列。仅仅由7000行Scala编写，据了解，Kafka每秒可以生产约25万消息（50 MB），每秒处理55万消息（110 MB）。

在 kafka的核心思路中，不需要在内存里缓存数据，因为操作系统的文件缓存已经足够完善和强大，只要不做随机写，顺序读写的性能是非常高效的。kafka 的数据只会顺序append，数据的删除策略是累积到一定程度或者超过一定时间再删除。Kafka另一个独特的地方是将消费者信息保存在客户端而不是MQ 服务器，这样服务器就不用记录消息的投递过程，每个客户端都自己知道自己下一次应该从什么地方什么位置读取消息，消息的投递过程也是采用客户端主动 pull的模型，这样大大减轻了服务器的负担。Kafka还强调减少数据的序列化和拷贝开销，它会将一些消息组织成Message Set做批量存储和发送，并且客户端在pull数据的时候，尽量以zero-copy的方式传输，利用sendfile(对应java里的 FileChannel.transferTo/transferFrom)这样的高级IO函数来减少拷贝开销。可见，kafka是一个精心设计，特定于某些应用的MQ系统，这种偏向特定领域的MQ系统我估计会越来越多，垂直化的产品策略值的考虑。

kafka官网地址：http://sna-projects.com/kafka/

猜你喜欢

转载自primernd.iteye.com/blog/2054011

Kafka之海量数据处理

海量数据处理之四：堆

海量数据处理之bitmap

海量数据处理

海量数据处理、

海量数据处理之数据库索引及优化

海量数据处理方法

海量数据处理总结

海量数据处理分析

海量数据处理汇总

9 海量数据处理

海量数据处理（转）

浅谈海量数据处理

海量数据处理技巧

海量数据处理实例

Mysql海量数据处理

海量数据处理：BitMap

海量数据处理思路

海量数据处理思想

海量数据处理之Bloom Filter详解

海量数据处理之五：面试题整理

海量数据处理之Tire树（字典树）

海量数据处理之Top K问题

Shell之海量数据处理grep，cut，awk，sed

【大数据】海量数据处理方法

海量数据处理和数据挖掘

海量数据处理 - （top K问题）

海量数据处理（2）-算法总结

海量数据处理——学习资料（一）

海量数据处理之三：Hash

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)