战斗民族开源 | ClickHouse万亿数据双中心的设计与实践 - 代码天地

战斗民族开源 | ClickHouse万亿数据双中心的设计与实践

编程语言 2021-04-04 15:31:55 阅读次数: 0

战斗民族开源 | ClickHouse万亿数据双中心的设计与实践

赵群大数据技术与架构

By 大数据技术与架构
场景描述：Clickhouse是一个用于联机分析处理（OLAP）的列式数据库管理系统。
传统数据库在数据大小比较小，索引大小适合内存，数据缓存命中率足够高的情形下能正常提供服务。但残酷的是，这种理想情形最终会随着业务的增长走到尽头，查询会变得越来越慢。你可能通过增加更多的内存，订购更快的磁盘等等来解决问题（纵向扩展），但这只是拖延解决本质问题。如果你的需求是解决怎样快速查询出结果，那么ClickHouse也许可以解决你的问题。
关键词：Clickhouse OLAP

大数据技术与架构之前分享过《OLAP》的文章，里面提到一个俄罗斯Yandex公司开源的轻量级数据库Clickhouse。这篇文章是来自百分点的赵群分享的关于基于clickhouse构建数据中心的经验。

场景与挑战

数据存储：

数据量：2000亿+/日
高峰：500WRow/s
延时：<30秒熔断/限流
2地双中心查询/分析透明访问

查询：

1TB常规查询<10s
1TB聚合查询(排序/分组）<5m

综上所述，业务场景：

OLAP引擎评估
超大规模的单表查询/分析
有一定的并发要求
实时性要求

期望OLAP引擎：

PB级的数据存储
高性能的查询/分析能力
低延时写入及吞吐能力
数据压缩
跨中心能力

Clickhouse的2地双中心设计

战斗民族开源 | ClickHouse万亿数据双中心的设计与实践

ClickHouse跨中心透明访问。性能影响：1/4 ～1/3
禁止分布式写。
经过设计Replication是有稳定保障的
Nginx负载均衡，路由分发，安全加固
日志采集、展现、分析

Clickhouse磁盘的Raid选择：

Raid5增加磁盘数据可靠性和读取能力
热备盘减少运维压力
控制写入，保障查询性能

相关测试分析表明：
横向扩展对查询性能几乎无影响
可以基于单节点/分区评估查询性能
数据预热对查询有数量级提升
针对缓存更换条件同样生效

Clickhouse的写入稳定性设计

战斗民族开源 | ClickHouse万亿数据双中心的设计与实践

平衡好合并速度和Part数量的关系，一定是需要相对均衡的
Part数量，实际代表着提交频率，一定是稳定，且经过估算的
ClickHouse的查询和写入共同受限于Query数限制，需要分配好配额
禁止直接写入分布式表
时间窗口保障持续稳定提交频率。(保障对ClickHouse写入的稳定)
SparkStreaming 微批处理(控制处理上限)，利用反压机制，实现处理能力动态平衡
Spark on Yarn 资源可控。
以写入ClickHouse为例，目前一个Executor处理在30000/s 左右。
假设我们需要一个满足300W/s的处理能力。在源读取没有瓶颈的情况下，可以 Executor数 : 300 /3 = 100(个)

Clickhouse的查询优化

战斗民族开源 | ClickHouse万亿数据双中心的设计与实践

限制单条查询内存使用量和单节点查询内存使用量，预防节点Down机。
Query数量限制异常:控制好配额/连接池。
集群的Query日志，找出慢查询。我们直接通过Nginx收集了原始日志。
针对热数据进行查询预热。

其他参数优化：

战斗民族开源 | ClickHouse万亿数据双中心的设计与实践

猜你喜欢

转载自blog.51cto.com/15127517/2684395

战斗民族开源 | ClickHouse万亿数据双中心的设计与实践

国产开源数据库，战斗在云原生时代

沸腾了！阿里双11万亿流量的分布式缓存设计实践，电子版参考指南开源了！！！

战斗民族居然在测试脱离全球互联网！

民族数据字典

关于民族的数据库表设计

js 56个民族数据

彪悍开源的分析数据库-ClickHouse

Oracle 批量插入数据-插入民族数据

民族mysql数据库表

腾讯万亿级大数据组件 TubeMQ 正式开源

开源配置中心和注册中心： Nacos 限流最佳实践

一个比 ClickHouse 还快的开源数据库

面向列存储的开源数据库ClickHouse介绍

开源是民族科技突破口，芯片、区块链发展空间可期

暴雪首席战斗设计师回顾副本的设计构思

回合制MMORPG战斗系统程序设计

（转）举例阐述游戏战斗系统设计的基本规则

Unity 教程：战斗系统中角色UI血条设计

Unity如何设计一个战斗系统

民族之歌

开源分析数据库ClickHouse和开源esProc SPL的性能对比

【clickhouse】clickhouse 最佳实践

MySQL开源数据传输中间件架构设计实践

微软开源数据处理引擎 Trill，每天可分析万亿次事件

鹅厂开源先锋，日均计算量超30万亿，全力打破数据墙

1800亿参数，支持中文，3.5万亿训练数据！开源类ChatGPT模型

战斗匹配

58集团处罚数据中心的设计与实践

阿里最新开源配置中心和注册中心： Nacos 限流最佳实践

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

Ubuntu 14.04 下Fuel6.0安装部署

香港一小巴侧翻致1死16伤警方：未见机件故障

pikachu--XSS盲打

阅读深入理解JVM虚拟机笔记一

java.sql.SQLException: ORA-00932: 数据类型不一致: 应为 -, 但却获得 CLOB

oracle delete all object under an user

[LeetCode]20 Valid Parentheses 有效的括号

树形DP求树的直径【模板】

Context propagation over HTTP in Go

【PAT】（B）1053 住房空置率 (20)*

每日归档

更多

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)