TPC-H ベンチマーク: Databend Cloud 対 Snowflake

概要

TPC-H

TPC-H ベンチマークは、複雑なクエリとデータ メンテナンスに焦点を当てた、意思決定支援システムを評価するための標準です。この分析では、22 クエリにわたる 100 GB のデータと約 6 億行を含む TPC-H SF100 (SF1 = 600 万行) データセットを使用して Databend Cloud と Snowflake を比較しました。

免責事項

TPC Benchmark™ および TPC-H™ は、Transaction Processing Performance Council ( TPC ) の商標です。私たちのベンチマークは TPC-H からインスピレーションを得ていますが、公式の TPC-H 結果と直接比較できるものではありません。

Snowflake と Databend Cloud

  • Snowflake : Snowflake は、分離されたストレージとコンピューティング、オンデマンドのスケーラブルなコンピューティング、データ共有、クローン作成機能などの高度な機能で知られています。
  • Databend Cloud : Databend Cloud は、 Snowflake と 同様の機能を提供し、ストレージをコンピューティングから分離し、必要に応じてスケーラブルなコンピューティング能力を提供するクラウドネイティブのデータ ウェアハウスです。これはオープンソースのDatabend プロジェクトから開発され 、Snowflake に代わる最新のコスト効率の高い代替手段として位置付けられており、特に大規模な分析に適しています。

性能とコストの比較

  • データ読み込みに関しては、Databend のコストは Snowflake よりも約 67% 低くなります。
  • クエリの実行に関しては、Databend は Snowflake よりも約 60% コスト効率が優れています。

知らせ

ベンチマークではチューニングは行われませんでした。結果は、Snowflake および Databend Cloud のデフォルト設定に基づいています。私たちの言葉をただ鵜呑みにするのではなく、ご自身で実行して結果を検証することをお勧めします。

データ読み込みベンチマーク

テーブル名 スノーフレーク(695個、コスト0.77ドル) Databend Cloud (446 個、コスト $0.25) 行数
お客様 18.137 13.436 15,000,000
ラインアイテム 477.740 305.812 600,037,902
国家 1.347 0.708 25
注文 103.088 64.323 150,000,000
一部 19.908 12.192 20,000,000
パーティーのサポート 67.410 45.346 80,000,000
地域 0.743 0.725 5
サプライヤー 3.000 3.687 10,000,000
合計時間 695秒 446秒
総費用 $0.77 $0.25
収納サイズ 20.8GB 24.5GB

クエリ ベンチマーク: コールド スタート

お問い合わせ スノーフレーク (合計 207 個、コスト $0.23) Databend Cloud (合計 166 個、コスト $0.09)
TPC-H1 11.703 8.036
TPC-H2 4.524 3.786
TPC-H3 8.908 6.040
TPC-H4 8.108 4.462
TPC-H5 9.202 7.014
TPC-H6 1.237 3.234
TPC-H7 9.082 7.345
TPC-H8 10.886 8.976
TPC-H9 18.152 13.340
TPC-H10 13.525 12.891
TPC-H11 2.582 2.183
TPC-H12 10.099 8.839
TPC-H13 13.458 7.206
TPC-H14 8.001 4.612
TPC-H15 8.737 4.621
TPC-H16 4.864 1.645
TPC-H17 5.363 14.315
TPC-H18 19.971 12.058
TPC-H19 9.893 12.579
TPC-H20 8.538 8.836
TPC-H21 16.439 12.270
TPC-H22 3.744 1.926
合計時間 207秒 166秒
総費用 $0.23 $0.09

クエリ ベンチマーク: ウォーム スタート

お問い合わせ スノーフレーク (合計 138 個、コスト $0.15) Databend Cloud (合計 124 秒、コスト 0.07 ドル)
TPC-H1 8.934 7.568
TPC-H2 3.018 3.125
TPC-H3 6.089 5.234
TPC-H4 4.914 3.392
TPC-H5 5.800 4.857
TPC-H6 0.891 2.142
TPC-H7 5.381 4.389
TPC-H8 5.724 5.887
TPC-H9 10.283 9.621
TPC-H10 10.368 8.524
TPC-H11 1.165 1.364
TPC-H12 7.052 5.352
TPC-H13 12.829 6.180
TPC-H14 3.288 2.725
TPC-H15 3.475 2.748
TPC-H16 4.094 1.124
TPC-H17 4.203 13.757
TPC-H18 18.583 11.630
TPC-H19 3.888 7.881
TPC-H20 6.379 5.797
TPC-H21 10.287 9.806
TPC-H22 1.573 1.122
合計時間 138秒 124秒
総費用 $0.15 $0.07

ベンチマークの再現

以下の手順に従ってベンチマークを再現できます。

ベンチマーク環境

Snowflake と Databend Cloud は両方とも同様の条件でテストされました。

パラメータ スノーフレーク データベンドクラウド
クラスターサイズの計算 小さい 小さい
vCPU 16 16
価格 $4/時間 2ドル/時間
AWS リージョン 米国東部-2 米国東部-2
ストレージ AWS S3 AWS S3
  • Amazon Redshiftから取得した TPC-H SF100 データセットは、 特別な調整を行わずに Databend Cloud と Snowflake にロードされました。

ベンチマーク方法

クエリ実行のホット ラウンドとコールド ラウンドを実行しました。

  1. コールド ラン: データ ウェアハウスはクエリを実行する前に一時停止され、再開されます。
  2. ホット ラン: データ ウェアハウスは一時停止されず、ローカル ディスク キャッシュを使用します。

前提条件

データロード

  1. スノーフレーク データの読み込み:

  2. データベンド クラウド データの読み込み:

TPC-H クエリ

  1. スノーフレーククエリ:

  2. Databend Cloud 查询

Linus 亲自动手,阻止内核开发者用空格替换制表符 父亲是少数会写代码的领导人、次子是开源科技部主管、幼子是开源核心贡献者 华为:用 1 年时间将 5000 个常用手机应用全面迁移至鸿蒙 Java 是最容易出现第三方漏洞的语言 鸿蒙之父王成录:开源鸿蒙是我国基础软件领域唯一一次架构创新 马化腾周鸿祎握手“泯恩仇” 前微软开发人员:Windows 11 性能“糟糕得可笑” 虽然老乡鸡开源的不是代码,但背后的原因却让人很暖心 Meta Llama 3 正式发布 谷歌宣布进行大规模重组
{{o.name}}
{{m.name}}

おすすめ

転載: my.oschina.net/u/5489811/blog/11044358