ClickHouse 的第一篇 研究论文:如何让现代数据分析数据库实现超高速性能?

图片

本文字数:3245;估计阅读时间:9 分钟

作者:ClickHouse Team

本文在公众号【ClickHouseInc】首发

图片

我们非常激动地宣布,第一篇关于 ClickHouse 的研究论文【chrome-extension://mhnlakgilnojmhinhkckjpncpbhabphi/pages/pdf/web/viewer.html?file=https%3A%2F%2Fwww.vldb.org%2Fpvldb%2Fvol17%2Fp3731-schulze.pdf】已成功被 VLDB 接收并发表【https://www.vldb.org/pvldb/volumes/17/#issue-12】。

VLDB(国际大规模数据库会议)是全球数据管理领域的顶级会议之一。在数百篇投稿中,VLDB 的录取率通常只有约 20%。

今年的 VLDB 2024 【https://vldb.org/2024/】在中国广州举行,恰逢会议创办 50 周年,成为历史最悠久的数据管理学术会议之一。

本次会议展示了 250 篇研究论文,并举办了 10 场研讨会,涵盖最新的研究成果和行业发展趋势。

今年的主导话题是各种形态的机器学习,但在数据库核心领域,例如查询引擎、存储技术和数据库理论等方面,依然有大量的研究论文亮相。

图片

ClickHouse 论文抢先看

这篇论文是历时数月、多个团队合作的成果,向读者介绍了 ClickHouse 在架构和系统设计上独具特色的亮点,让它成为一款超高速数据库。现在,这篇论文首次公开发布!

在论文中,您将了解到:

ClickHouse 的发展历程

我们介绍了文中提到的主要功能是什么时候引入的,以及未来将有哪些新功能和改进。

图片

ClickHouse 的架构设计

包括其架构层次、核心组件和不同的执行模式。

图片

ClickHouse 的存储机制

介绍了磁盘存储格式、数据剪枝技术、数据合并时的转换、更新与删除、幂等插入、数据复制以及 ACID 合规性等。

图片

ClickHouse 的查询处理

涵盖了 SIMD 并行化、多核并行化、多节点并行化及其性能优化技术。

ClickHouse 的集成能力

支持 90 多种文件格式和 50 多种外部系统的无缝集成。

图片

性能对比

展示了 ClickHouse 与其他常用分析数据库的性能对比。注意:分数越低代表性能越好。

图片

希望这些信息能够引发您的兴趣。如果您想了解更多,现在就可以点击阅读完整论文: chrome-extension://mhnlakgilnojmhinhkckjpncpbhabphi/pages/pdf/web/viewer.html?file=https%3A%2F%2Fwww.vldb.org%2Fpvldb%2Fvol17%2Fp3731-schulze.pdf

ClickHouse 在 VLDB 2024

论文展示

图片

我们公司的 CTO 和 ClickHouse 创始人 Alexey Milovidov 上周在广州的 VLDB 会议上分享了我们的研究论文【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/vldb_2024/VLDB_2024_presentation.pdf】,并进行了一场引人入胜的问答环节(时间不够用了!)。您可以在这里观看录制的演讲:https://youtu.be/7QXKBKDOkJE

海报展示

除了论文展示外,所有被 VLDB 接受论文的作者还在现场进行了海报展示【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/vldb_2024/VLDB_2024_poster.pdf】。

图片

特别见面会

碰巧的是,我们还在 VLDB 之前几天举办了一场 ClickHouse Guangzhou Meetup,在会上我们展示了 Alexey 会议演讲(幻灯片:https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/meetup121/GZ%20meetup%20by%20Tom%20and%20Robert.pdf)的扩展版:https://youtu.be/vyYjKuvnSY0

我们的第一篇研究论文之旅

我们为好奇的读者准备了一个特别环节,讲述这篇研究论文背后的故事。

自从 2016 年 ClickHouse 开源以来,它的受欢迎程度持续上升,开发速度也迅猛加快。在过去的八年里,ClickHouse 团队一直专注于打造全球最快的分析数据库,因而没有时间发表相关的学术论文。

图片

然而,2023 年 10 月,在法国里维埃拉地中海沿岸的一次公司外部会议上,我们的产品和市场副总裁 Tanya Bragin 提出,应该撰写一篇关于 ClickHouse 的基础性论文,并提交给今年在中国广州举办的 VLDB 大会。

图片

我们迅速组成了一个小型团队撰写论文,虽然有些作者在攻读博士学位时曾写过研究论文,但对其他成员来说,这是全新的体验。自 2023 年 11 月起,我们开始了紧张的写作过程,几乎每天都进行状态更新,最终于 2024 年 4 月提交了论文。

图片

总结

图片

上周,我们在广州参加了 VLDB 2024 50 周年特别会议,不仅享受了丰富的粤菜盛宴,ClickHouse 团队还度过了充实的一周。我们的 CTO 兼 ClickHouse 创始人 Alexey Milovidov 向科学界首次展示了 ClickHouse 的研究成果。

我们希望您能喜欢阅读这篇论文,并观看 Alexey 的演讲录像。同时,欢迎随时与我们分享您的反馈意见。

最后,我们为您整理了相关资料和链接,供参考:

  • VLDB 2024 研究论文:《ClickHouse - 极速分析数据库》【chrome-extension://mhnlakgilnojmhinhkckjpncpbhabphi/pages/pdf/web/viewer.html?file=https%3A%2F%2Fwww.vldb.org%2Fpvldb%2Fvol17%2Fp3731-schulze.pdf】 + 海报【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/vldb_2024/VLDB_2024_poster.pdf】

  • Alexey Milovidov 在 VLDB 2024 上的论文演讲录像【https://youtu.be/7QXKBKDOkJE】 + 幻灯片【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/vldb_2024/VLDB_2024_presentation.pdf】

  • 我们在广州见面会上展示的 VLDB 2024 扩展演讲版录像【https://youtu.be/vyYjKuvnSY0】 + 幻灯片【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/meetup121/GZ%20meetup%20by%20Tom%20and%20Robert.pdf】

征稿启示

面向社区长期正文,文章内容包括但不限于关于 ClickHouse 的技术研究、项目实践和创新做法等。建议行文风格干货输出&图文并茂。质量合格的文章将会发布在本公众号,优秀者也有机会推荐到 ClickHouse 官网。请将文章稿件的 WORD 版本发邮件至:[email protected]

​​联系我们

手机号:13910395701

邮箱:[email protected]

满足您所有的在线分析列式数据库管理需求

猜你喜欢

转载自blog.csdn.net/ClickHouseDB/article/details/142412619