Punto de referencia TPC-H: Databend Cloud frente a Snowflake

Vista rápida

TPC-H

El punto de referencia TPC-H es un estándar para evaluar sistemas de soporte de decisiones, centrándose en consultas complejas y mantenimiento de datos. En este análisis, comparamos Databend Cloud y Snowflake utilizando el conjunto de datos TPC-H SF100 (SF1 = 6 millones de filas), que contiene 100 GB de datos y aproximadamente 600 millones de filas, que abarcan 22 consultas.

Descargo de responsabilidad

TPC Benchmark™ y TPC-H™ son marcas comerciales de Transaction Processing Performance Council ( TPC ). Nuestros puntos de referencia, aunque inspirados en el TPC-H, no son directamente comparables con los resultados oficiales del TPC-H.

Copo de nieve y nube de Databend

  • Snowflake : Snowflake es conocido por sus funciones avanzadas, como almacenamiento y computación desacoplados, computación escalable bajo demanda, intercambio de datos y capacidades de clonación.
  • Databend Cloud : Databend Cloud proporciona una funcionalidad similar a Snowflake y es un almacén de datos nativo de la nube que también separa el almacenamiento de la informática y proporciona potencia informática escalable según sea necesario. Fue desarrollado a partir del  proyecto de código abierto Databend y se posiciona como una alternativa moderna y rentable a Snowflake, especialmente adecuada para análisis a gran escala.

Comparación de rendimiento y costos

  • En términos de carga de datos, el costo de Databend es aproximadamente un 67% menor que el de Snowflake.
  • En términos de ejecución de consultas, Databend es aproximadamente un 60% más rentable que Snowflake.

Aviso

No se realizó ningún ajuste en el punto de referencia. Los resultados se basan en la configuración predeterminada de Snowflake y Databend Cloud. Recuerde, no confíe sólo en nuestra palabra: le recomendamos que lo ejecute usted mismo y verifique estos resultados.

Punto de referencia de carga de datos

Nombre de la tabla Copo de nieve(695s, cuesta $0,77) Nube de Databend (446, cuesta $0,25) Número de líneas
cliente 18.137 13.436 15.000.000
Elemento en linea 477.740 305.812 600.037.902
nación 1.347 0.708 25
pedidos 103.088 64.323 150.000.000
parte 19.908 12.192 20.000.000
apoyo del partido 67.410 45.346 80.000.000
región 0.743 0,725 5
proveedor 3.000 3.687 10.000.000
Tiempo Total 695s 446s
coste total $0.77 $0.25
Tamaño de almacenamiento 20,8GB 24,5GB

Punto de referencia de consulta: arranque en frío

Preguntar Copo de nieve (207 en total, cuesta $ 0,23) Databend Cloud (166 en total, cuesta $0,09)
TPC-H 1 11.703 8.036
TPC-H 2 4.524 3.786
TPC-H 3 8.908 6.040
TPC-H 4 8.108 4.462
TPC-H 5 9.202 7.014
TPC-H 6 1.237 3.234
TPC-H 7 9.082 7.345
TPC-H 8 10.886 8.976
TPC-H 9 18.152 13.340
TPC-H 10 13.525 12.891
TPC-H 11 2.582 2.183
TPC-H 12 10.099 8.839
TPC-H 13 13.458 7.206
TPC-H 14 8.001 4.612
TPC-H 15 8.737 4.621
TPC-H 16 4.864 1.645
TPC-H 17 5.363 14.315
TPC-H 18 19.971 12.058
TPC-H 19 9.893 12.579
TPC-H 20 8.538 8.836
TPC-H 21 16.439 12.270
TPC-H 22 3.744 1.926
Tiempo Total 207 166s
coste total $0.23 $0.09

Comparativa de consultas: inicio en caliente

Preguntar Copo de nieve (138 en total, cuesta $0,15) Databend Cloud (124 en total, cuesta $0,07)
TPC-H 1 8.934 7.568
TPC-H 2 3.018 3.125
TPC-H 3 6.089 5.234
TPC-H 4 4.914 3.392
TPC-H 5 5.800 4.857
TPC-H 6 0.891 2.142
TPC-H 7 5.381 4.389
TPC-H 8 5.724 5.887
TPC-H 9 10.283 9.621
TPC-H 10 10.368 8.524
TPC-H 11 1.165 1.364
TPC-H 12 7.052 5.352
TPC-H 13 12.829 6.180
TPC-H 14 3.288 2.725
TPC-H 15 3.475 2.748
TPC-H 16 4.094 1.124
TPC-H 17 4.203 13.757
TPC-H 18 18.583 11.630
TPC-H 19 3.888 7.881
TPC-H 20 6.379 5.797
TPC-H 21 10.287 9.806
TPC-H 22 1.573 1.122
Tiempo Total 138s 124s
coste total $0.15 $0.07

Reproducción de puntos de referencia

Puede reproducir el punto de referencia siguiendo los pasos a continuación.

Entorno de referencia

Tanto Snowflake como Databend Cloud se probaron en condiciones similares:

parámetro Copo de nieve Nube de datos bend
Calcular el tamaño del clúster pequeño pequeño
CPU virtual dieciséis dieciséis
precio $4/hora $2/hora
Región de AWS nosotros-este-2 nosotros-este-2
almacenamiento AWS S3 AWS S3
  • El conjunto de datos TPC-H SF100, procedente de  Amazon Redshift , se cargó en Databend Cloud y Snowflake sin ningún ajuste específico.

Método de evaluación comparativa

Realizamos rondas frías y calientes de ejecución de consultas:

  1. Ejecución en frío : el almacén de datos se suspende y se reanuda antes de ejecutar la consulta.
  2. Ejecución en caliente : el almacén de datos no está suspendido y utiliza caché de disco local.

requisitos previos

Carga de datos

  1. Carga de datos de copo de nieve :

  2. Carga de datos en la nube de Databend :

consulta TPC-H

  1. Consulta de copo de nieve :

  2. Databend Cloud 查询

Linus 亲自动手,阻止内核开发者用空格替换制表符 父亲是少数会写代码的领导人、次子是开源科技部主管、幼子是开源核心贡献者 华为:用 1 年时间将 5000 个常用手机应用全面迁移至鸿蒙 Java 是最容易出现第三方漏洞的语言 鸿蒙之父王成录:开源鸿蒙是我国基础软件领域唯一一次架构创新 马化腾周鸿祎握手“泯恩仇” 前微软开发人员:Windows 11 性能“糟糕得可笑” 虽然老乡鸡开源的不是代码,但背后的原因却让人很暖心 Meta Llama 3 正式发布 谷歌宣布进行大规模重组
{{o.name}}
{{m.name}}

Supongo que te gusta

Origin my.oschina.net/u/5489811/blog/11044358
Recomendado
Clasificación