vertica优化

DELETE_VECTORS

数据模型:

1、 规范化你的表

2、 使用核实的压缩格式

表设计:

1、 使用分区

2、 定义主键外键

3、 默认的数字类型长度可能比实际需要的大。例如:NUMBERC 该类型默认的长度是38位,如果实际的长度比这个小,那你建表的时候最好加上适合的长度。

4、 对于一个True/False值,Boolean类型比char(1)类型和integer类型更快。

Projections

1、 Segmentation vs. Replication (unsegmented)简单的说,如果数据量大的话使用Segmentation,小的话使用unsegmented

2、 使用order by ,理想的order by 的字段应该全部在where查询字句中出现(详见另一篇文章【】)

3、 列长度的规范,不要一味的定义大长度,在过滤条件和join时的字段如果是字符类型,最好使用int类型。

4、 GROUP BY:使用group by 时,一定要explain查看执行计划,如果执行计划中使用的【GROUP BY HASH】这时候就要修改你的查询sql或者projection的,group by最好使用【GROUP BY PIPELINE】这种方式使用更少的内存,查询更快!

5、 清楚不必要的projection,多余的projection意味着查询是要花费更多的时间去选择。

6、 Projection中的order 字段首先选用过滤的字段,然后选用join使用的列。

7、 确保Projection数据均匀分布在各个节点上,以免查询时产生数据倾斜。

查询:

1、 避免使用in

2、 避免使用union

3、 Select 时避免使用*,查询时选择合适的列

4、 使用with子句

5、 避免使用别名,例如 groupby 1,2,3

6、 在子查询中使用orderby

7、 避免使用不等关系,例如:>=,not in 等

8、 对于复杂的sql,可以多使用临时表

9、 delete_vectors中的数据尽量清除

资源(Resources)

1、 PROFILE,查看查询所需要的内存

2、 建立专用的资源池

猜你喜欢

转载自windyqin.iteye.com/blog/2331763