oracle partition by group by详解

group by 必须与聚合函数一起使用,最终使用的结果是将多行变成一行,默认取第一行,可能丢失数据

partition by 也是分组,不过不会丢失数据,只是把数据做分组

1. group by是分组函数,partition by是分析函数(然后像sum()等是聚合函数);

2. 在执行顺序上,

以下是常用sql关键字的优先级

from > where > group by > having > order by

而partition by应用在以上关键字之后,实际上就是在执行完select之后,在所得结果集之上进行partition。

3.partition by相比较于group by,能够在保留全部数据的基础上,只对其中某些字段做分组排序(类似excel中的操作),而group by则只保留参与分组的字段和聚合函数的结果(类似excel中的pivot)。

partition by

fa3e50e5636cd05675d4dfd937aafec1.png

group by

80cfb7ed31278e11abb64d42dda5a6cc.png

4.如果在partition结果上聚合,千万注意聚合函数是逐条累计运行结果的!而在group by后的结果集上使用聚合函数,会作用在分组下的所有记录上。

数据如下,

d71ef41945e5a35552828b66b44a0e8e.png

SQL1

select a.cc,a.item,sum(a.num)

from table_temp a

group by a.cc,a.item

Result1

5a6cd62321657f9387542074726e8a80.png

11条记录经group by后为10条,其中cc='cn' and item='8.1.1'对应的两条记录的num汇总成值3.

SQL2

select a.cc,a.num, min(a.num) over (partition by a.cc order by a.num asc) as amount

from table_temp a

group by a.cc,a.num;

select a.cc,a.num, min(a.num) over (partition by a.cc order by a.num desc) as amount

from table_temp a

group by a.cc,a.num;

Result2

41408488b7be258e4dd4ced08b78a0a8.png  

e1ebaf7d3bcfab442a657e95e384d26d.png

两个sql的唯一区别在于a.num的排序上,但从结果红框中的数据对比可以看到amount值并不相同,且第二个结果集amount并不都是最小值1。

在这里就是要注意将聚合函数用在partition后的结果集上时,聚合函数是逐条累积计算值的!

其实partition by常同row_number() over一起使用,

select a.*, row_number() over (partition by a.cc,a.item order by a.num desc) as seq

from table_temp a

b136333e0b8681630cf426c66c7100b4.png

SQL中只要用到聚合函数就一定要用到group by 吗?

答:看情况

1、当只做聚集函数查询时候,就不需要进行分组了。
2、当聚集函数和非聚集函数出现在一起时,需要将非聚集函数进行group by

举例来说:
情况一:
不需要使用Group by 进行分组,因为其中没有非聚合字段,所以不用Group by 也可以。
SELECT SUM(bonus) FROM person

情况二:
SELECT SUM(bonus),gender FROM person GROUP BY gender

由于gender是非聚合字段,Group by 后才可以正常执行。
 

猜你喜欢

转载自blog.csdn.net/Maxiao1204/article/details/129149952