阅读-阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读 - 代码天地

阅读-阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读

其他 2019-06-15 17:28:05 阅读次数: 0

原文地址https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247488245&idx=1&sn=1c70a32f11da7916cb402933fb65dd9f&chksm=e9292ffade5ea6ec7c6233f09d3786c75d02b91a91328b251d8689e8dd8162d55632a3ea61a1&scene=21#wechat_redirect

TPS：系统吞吐量，每秒钟request/事务数量

　　搜索离线：将各种来源数据转换处理后送入搜索引擎等“在线”服务的系统统称为“离线”系统。

其他的我是真的看不懂

来源https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247488245&idx=1&sn=1c70a32f11da7916cb402933fb65dd9f&chksm=e9292ffade5ea6ec7c6233f09d3786c75d02b91a91328b251d8689e8dd8162d55632a3ea61a1&scene=21#wechat_redirect

★ 基于Hbase的存储架构

搜索离线大约在2012年即引入了Hbase作为数据的存储引擎，有力的支持了搜索业务从淘宝主搜到离线平台的整个发展历程，历经多次双11考验，稳定性和性能都得到明确的验证。从功能层面，搜索离线引入Hbase的原因主要是以下几点：

通过Scan/Get可以批量/单条的获取数据，通过bulkload/put可以批量/单条的导入数据，这与搜索的全量/增量模型完全吻合，天然适合支持搜索离线业务。
底层存储基于HDFS，LSM-Tree的的架构能够确保数据安全性，计算存储分离的架构保证了集群规模水平可扩展，易于提高整体的吞吐。通过单机性能优化（Async、BucketCache、Handler分层、Offheap）和集群的扩容，确保了业务大幅增长时，存储从来没有成为系统的瓶颈。
Free Schema的特性能够很好的应对业务数据频繁变化的情况，也能够方便支持一些特殊业务场景的数据逻辑。

通过引入Hbase做为离线系统的内部数据存储，我们成功解决了每天全量时对上游Mysql造成很大压力的问题，大幅度的提升了整体系统的吞吐。数据存储到Hbase也是全量任务向流式处理流程转型（MR->Stream）的基础，而这一点为后来Blink流引擎在搜索离线的孕育和发展也埋下了伏笔。

当然Hbase也不是毫无缺点，JVM内存管理的痼疾、单机Handler打满导致雪崩、缺乏容器化部署能力等也带来了不少烦恼，很快我们就会替换Hbase为阿里内部发展的另外一套存储引擎，期望能够部分的解决这些问题。

猜你喜欢

转载自www.cnblogs.com/0710whh/p/11028132.html

阅读-阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读

阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读

阅读心得5：《阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读》

《阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读》阅读笔记

《阿里如何实现秒级百万TPS？搜索离线大数据平台架构解读》读后感

揭秘阿里秒级百万TPS平台架构实现

百万TPS高吞吐、秒级低延迟，阿里搜索离线平台如何实现？

大数据平台架构

《离线和实时大数据开发实战》（二）大数据平台架构 & 技术概览

小红书如何实现高效推荐？解密背后的大数据计算平台架构

一个每秒达到600百万TPS的零售金融平台架构

大数据平台架构思考

Hadoop大数据平台架构与实践

详解大数据平台架构

最简单的大数据平台架构

大数据平台架构的层次划分

大数据平台架构设计

深度好文！多年架构师经验，详解阿里内部大数据平台架构

一文详解被阿里腾讯视作核心机密的大数据平台架构

18级大数据专家，跟大家漫谈大数据平台架构，你能学到多少？上篇

数据平台架构

淘宝，滴滴，美团各大厂是如何搭建大数据平台架构的？

大数据下的数据分析平台架构

【数据开发】大数据平台架构，Hive / THive介绍

Kafka是如何支持百万级TPS的？

大数据平台架构——通用版

hadoop大数据平台架构之DKhadoop详解

大数据平台架构技术选型与场景运用

58大数据平台架构演进-图

大数据平台架构技术选型与场景运用(转)

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)