本文字数:3245;估计阅读时间:9 分钟
作者:ClickHouse Team
本文在公众号【ClickHouseInc】首发
我们非常激动地宣布,第一篇关于 ClickHouse 的研究论文【chrome-extension://mhnlakgilnojmhinhkckjpncpbhabphi/pages/pdf/web/viewer.html?file=https%3A%2F%2Fwww.vldb.org%2Fpvldb%2Fvol17%2Fp3731-schulze.pdf】已成功被 VLDB 接收并发表【https://www.vldb.org/pvldb/volumes/17/#issue-12】。
VLDB(国际大规模数据库会议)是全球数据管理领域的顶级会议之一。在数百篇投稿中,VLDB 的录取率通常只有约 20%。
今年的 VLDB 2024 【https://vldb.org/2024/】在中国广州举行,恰逢会议创办 50 周年,成为历史最悠久的数据管理学术会议之一。
本次会议展示了 250 篇研究论文,并举办了 10 场研讨会,涵盖最新的研究成果和行业发展趋势。
今年的主导话题是各种形态的机器学习,但在数据库核心领域,例如查询引擎、存储技术和数据库理论等方面,依然有大量的研究论文亮相。
ClickHouse 论文抢先看
这篇论文是历时数月、多个团队合作的成果,向读者介绍了 ClickHouse 在架构和系统设计上独具特色的亮点,让它成为一款超高速数据库。现在,这篇论文首次公开发布!
在论文中,您将了解到:
ClickHouse 的发展历程
我们介绍了文中提到的主要功能是什么时候引入的,以及未来将有哪些新功能和改进。
ClickHouse 的架构设计
包括其架构层次、核心组件和不同的执行模式。
ClickHouse 的存储机制
介绍了磁盘存储格式、数据剪枝技术、数据合并时的转换、更新与删除、幂等插入、数据复制以及 ACID 合规性等。
ClickHouse 的查询处理
涵盖了 SIMD 并行化、多核并行化、多节点并行化及其性能优化技术。
ClickHouse 的集成能力
支持 90 多种文件格式和 50 多种外部系统的无缝集成。
性能对比
展示了 ClickHouse 与其他常用分析数据库的性能对比。注意:分数越低代表性能越好。
希望这些信息能够引发您的兴趣。如果您想了解更多,现在就可以点击阅读完整论文: chrome-extension://mhnlakgilnojmhinhkckjpncpbhabphi/pages/pdf/web/viewer.html?file=https%3A%2F%2Fwww.vldb.org%2Fpvldb%2Fvol17%2Fp3731-schulze.pdf
ClickHouse 在 VLDB 2024
论文展示
我们公司的 CTO 和 ClickHouse 创始人 Alexey Milovidov 上周在广州的 VLDB 会议上分享了我们的研究论文【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/vldb_2024/VLDB_2024_presentation.pdf】,并进行了一场引人入胜的问答环节(时间不够用了!)。您可以在这里观看录制的演讲:https://youtu.be/7QXKBKDOkJE
海报展示
除了论文展示外,所有被 VLDB 接受论文的作者还在现场进行了海报展示【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/vldb_2024/VLDB_2024_poster.pdf】。
特别见面会
碰巧的是,我们还在 VLDB 之前几天举办了一场 ClickHouse Guangzhou Meetup,在会上我们展示了 Alexey 会议演讲(幻灯片:https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/meetup121/GZ%20meetup%20by%20Tom%20and%20Robert.pdf)的扩展版:https://youtu.be/vyYjKuvnSY0
我们的第一篇研究论文之旅
我们为好奇的读者准备了一个特别环节,讲述这篇研究论文背后的故事。
自从 2016 年 ClickHouse 开源以来,它的受欢迎程度持续上升,开发速度也迅猛加快。在过去的八年里,ClickHouse 团队一直专注于打造全球最快的分析数据库,因而没有时间发表相关的学术论文。
然而,2023 年 10 月,在法国里维埃拉地中海沿岸的一次公司外部会议上,我们的产品和市场副总裁 Tanya Bragin 提出,应该撰写一篇关于 ClickHouse 的基础性论文,并提交给今年在中国广州举办的 VLDB 大会。
我们迅速组成了一个小型团队撰写论文,虽然有些作者在攻读博士学位时曾写过研究论文,但对其他成员来说,这是全新的体验。自 2023 年 11 月起,我们开始了紧张的写作过程,几乎每天都进行状态更新,最终于 2024 年 4 月提交了论文。
总结
上周,我们在广州参加了 VLDB 2024 50 周年特别会议,不仅享受了丰富的粤菜盛宴,ClickHouse 团队还度过了充实的一周。我们的 CTO 兼 ClickHouse 创始人 Alexey Milovidov 向科学界首次展示了 ClickHouse 的研究成果。
我们希望您能喜欢阅读这篇论文,并观看 Alexey 的演讲录像。同时,欢迎随时与我们分享您的反馈意见。
最后,我们为您整理了相关资料和链接,供参考:
-
VLDB 2024 研究论文:《ClickHouse - 极速分析数据库》【chrome-extension://mhnlakgilnojmhinhkckjpncpbhabphi/pages/pdf/web/viewer.html?file=https%3A%2F%2Fwww.vldb.org%2Fpvldb%2Fvol17%2Fp3731-schulze.pdf】 + 海报【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/vldb_2024/VLDB_2024_poster.pdf】
-
Alexey Milovidov 在 VLDB 2024 上的论文演讲录像【https://youtu.be/7QXKBKDOkJE】 + 幻灯片【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/vldb_2024/VLDB_2024_presentation.pdf】
-
我们在广州见面会上展示的 VLDB 2024 扩展演讲版录像【https://youtu.be/vyYjKuvnSY0】 + 幻灯片【https://raw.githubusercontent.com/ClickHouse/clickhouse-presentations/master/meetup121/GZ%20meetup%20by%20Tom%20and%20Robert.pdf】
征稿启示
面向社区长期正文,文章内容包括但不限于关于 ClickHouse 的技术研究、项目实践和创新做法等。建议行文风格干货输出&图文并茂。质量合格的文章将会发布在本公众号,优秀者也有机会推荐到 ClickHouse 官网。请将文章稿件的 WORD 版本发邮件至:[email protected]
联系我们
手机号:13910395701
满足您所有的在线分析列式数据库管理需求