概要
TPC-H
TPC-H ベンチマークは、複雑なクエリとデータ メンテナンスに焦点を当てた、意思決定支援システムを評価するための標準です。この分析では、22 クエリにわたる 100 GB のデータと約 6 億行を含む TPC-H SF100 (SF1 = 600 万行) データセットを使用して Databend Cloud と Snowflake を比較しました。
免責事項
TPC Benchmark™ および TPC-H™ は、Transaction Processing Performance Council ( TPC ) の商標です。私たちのベンチマークは TPC-H からインスピレーションを得ていますが、公式の TPC-H 結果と直接比較できるものではありません。
Snowflake と Databend Cloud
- Snowflake : Snowflake は、分離されたストレージとコンピューティング、オンデマンドのスケーラブルなコンピューティング、データ共有、クローン作成機能などの高度な機能で知られています。
- Databend Cloud : Databend Cloud は、 Snowflake と 同様の機能を提供し、ストレージをコンピューティングから分離し、必要に応じてスケーラブルなコンピューティング能力を提供するクラウドネイティブのデータ ウェアハウスです。これはオープンソースのDatabend プロジェクトから開発され 、Snowflake に代わる最新のコスト効率の高い代替手段として位置付けられており、特に大規模な分析に適しています。
性能とコストの比較
- データ読み込みに関しては、Databend のコストは Snowflake よりも約 67% 低くなります。
- クエリの実行に関しては、Databend は Snowflake よりも約 60% コスト効率が優れています。
知らせ
ベンチマークではチューニングは行われませんでした。結果は、Snowflake および Databend Cloud のデフォルト設定に基づいています。私たちの言葉をただ鵜呑みにするのではなく、ご自身で実行して結果を検証することをお勧めします。
データ読み込みベンチマーク
テーブル名 | スノーフレーク(695個、コスト0.77ドル) | Databend Cloud (446 個、コスト $0.25) | 行数 |
---|---|---|---|
お客様 | 18.137 | 13.436 | 15,000,000 |
ラインアイテム | 477.740 | 305.812 | 600,037,902 |
国家 | 1.347 | 0.708 | 25 |
注文 | 103.088 | 64.323 | 150,000,000 |
一部 | 19.908 | 12.192 | 20,000,000 |
パーティーのサポート | 67.410 | 45.346 | 80,000,000 |
地域 | 0.743 | 0.725 | 5 |
サプライヤー | 3.000 | 3.687 | 10,000,000 |
合計時間 | 695秒 | 446秒 | |
総費用 | $0.77 | $0.25 | |
収納サイズ | 20.8GB | 24.5GB |
クエリ ベンチマーク: コールド スタート
お問い合わせ | スノーフレーク (合計 207 個、コスト $0.23) | Databend Cloud (合計 166 個、コスト $0.09) |
---|---|---|
TPC-H1 | 11.703 | 8.036 |
TPC-H2 | 4.524 | 3.786 |
TPC-H3 | 8.908 | 6.040 |
TPC-H4 | 8.108 | 4.462 |
TPC-H5 | 9.202 | 7.014 |
TPC-H6 | 1.237 | 3.234 |
TPC-H7 | 9.082 | 7.345 |
TPC-H8 | 10.886 | 8.976 |
TPC-H9 | 18.152 | 13.340 |
TPC-H10 | 13.525 | 12.891 |
TPC-H11 | 2.582 | 2.183 |
TPC-H12 | 10.099 | 8.839 |
TPC-H13 | 13.458 | 7.206 |
TPC-H14 | 8.001 | 4.612 |
TPC-H15 | 8.737 | 4.621 |
TPC-H16 | 4.864 | 1.645 |
TPC-H17 | 5.363 | 14.315 |
TPC-H18 | 19.971 | 12.058 |
TPC-H19 | 9.893 | 12.579 |
TPC-H20 | 8.538 | 8.836 |
TPC-H21 | 16.439 | 12.270 |
TPC-H22 | 3.744 | 1.926 |
合計時間 | 207秒 | 166秒 |
総費用 | $0.23 | $0.09 |
クエリ ベンチマーク: ウォーム スタート
お問い合わせ | スノーフレーク (合計 138 個、コスト $0.15) | Databend Cloud (合計 124 秒、コスト 0.07 ドル) |
---|---|---|
TPC-H1 | 8.934 | 7.568 |
TPC-H2 | 3.018 | 3.125 |
TPC-H3 | 6.089 | 5.234 |
TPC-H4 | 4.914 | 3.392 |
TPC-H5 | 5.800 | 4.857 |
TPC-H6 | 0.891 | 2.142 |
TPC-H7 | 5.381 | 4.389 |
TPC-H8 | 5.724 | 5.887 |
TPC-H9 | 10.283 | 9.621 |
TPC-H10 | 10.368 | 8.524 |
TPC-H11 | 1.165 | 1.364 |
TPC-H12 | 7.052 | 5.352 |
TPC-H13 | 12.829 | 6.180 |
TPC-H14 | 3.288 | 2.725 |
TPC-H15 | 3.475 | 2.748 |
TPC-H16 | 4.094 | 1.124 |
TPC-H17 | 4.203 | 13.757 |
TPC-H18 | 18.583 | 11.630 |
TPC-H19 | 3.888 | 7.881 |
TPC-H20 | 6.379 | 5.797 |
TPC-H21 | 10.287 | 9.806 |
TPC-H22 | 1.573 | 1.122 |
合計時間 | 138秒 | 124秒 |
総費用 | $0.15 | $0.07 |
ベンチマークの再現
以下の手順に従ってベンチマークを再現できます。
ベンチマーク環境
Snowflake と Databend Cloud は両方とも同様の条件でテストされました。
パラメータ | スノーフレーク | データベンドクラウド |
---|---|---|
クラスターサイズの計算 | 小さい | 小さい |
vCPU | 16 | 16 |
価格 | $4/時間 | 2ドル/時間 |
AWS リージョン | 米国東部-2 | 米国東部-2 |
ストレージ | AWS S3 | AWS S3 |
- Amazon Redshiftから取得した TPC-H SF100 データセットは、 特別な調整を行わずに Databend Cloud と Snowflake にロードされました。
ベンチマーク方法
クエリ実行のホット ラウンドとコールド ラウンドを実行しました。
- コールド ラン: データ ウェアハウスはクエリを実行する前に一時停止され、再開されます。
- ホット ラン: データ ウェアハウスは一時停止されず、ローカル ディスク キャッシュを使用します。
前提条件
- Snowflake アカウントを持っている
- Databend Cloud アカウントを作成します 。
データロード
-
スノーフレーク データの読み込み:
- Snowflake アカウントにログインします 。
- TPC-Hスキーマに対応するテーブルを作成します。SQL スクリプト。
- コマンドを使用して
COPY INTO
AWS S3 からデータをロードします。SQL スクリプト。
-
データベンド クラウド データの読み込み:
- Databend Cloud アカウントにログインします 。
- TPC-H スキーマと一致して、必要なテーブルを作成します。SQL スクリプト。
- Snowflake のようなアプローチを使用して、AWS S3 からデータをロードします。SQL スクリプト。
TPC-H クエリ
-
スノーフレーククエリ:
- Snowflake アカウントにログインします 。
- TPC-H クエリを実行します。SQL スクリプト。
-
Databend Cloud 查询:
- 登录您的 Databend Cloud 账户.
- 运行 TPC-H 查询。SQL 脚本.
{{o.name}}
{{m.name}}