Oracle 根据某个字段对查询结果去重 三种方法详述

版权声明:转发请注明链接和出处,靴靴 https://blog.csdn.net/weixin_43525116/article/details/85167642

Oracle三种去重的方法

  • distinct
  • group by
  • rowid

分组函数:作用于一组数据,并对一组数据返回一个值

常见的分组函数有:
count 返回找到的记录数
min 返回一个数字列或计算列的最小值
max 返回一个数字列或计算列的最大值
sum 返回一个数字列或计算列总和
avg 返回一个数字列或计算列的平均值

一、distinct

distinct 单列

select distinct(a) from tableA;

distinct 多列

--会报错,distinct 必须放在 select 语句的最前方
select a, distinct b,c from tableA;
select distinct a,b,c from tableA;

多列的时候,上述语句是针对abc的组合来distinct的,列出的是abc的所有不同组合,相当于下列语句

select a,b,c from tableA group by a,b,c;

那么,如果想要分别查询a,b,c三个字段的distinct值怎么办?一开始可能只想到下列三个语句

select distinct a from tableA;
select distinct b from tableA;
select distinct c from tableA;

麻烦,如何合并成一个语句呢,使用union解决,后面拼接的字符串是为了标识这个值属于哪个字段:

select distinct(a) || ' a' from tableA
union all
select distinct(b) || ' b' from tableA
union all
select distinct(c) || ' c' from tableA

二、group by

只查询非分组函数,不需要使用group by

select Name, Gender from dba_data_files;

只要查询了分组函数,就需要使用group by

  1. 只查询分组函数的话,group by的子句里用到的列名Name 和 Gender,不需要写在select里;但select里出现别的列就会报错;
select sum(Age) from dba_data_files group by Name, Gender;

-- 但 select 里出现别的列就会报错,例:
select Weight, sum(Age) from dba_data_files group by Name, Gender;
  1. 同时查询分组函数和非分组函数,并且必须将分组函数以外的所有的列(Name 和 Gender),都写到group by里,少一个都不行;
select Name, Gender, sum(Age) from dba_data_files group by Name, Gender;

不管select是否使用了where子句,都可以使用group by子句

三、rowid

rowid简介

rowid是一个用来唯一标记表中行的伪列。它是物理表中行数据的内部地址,包含两个地址,其一为指向数据表中包含该行的块所存放数据文件的地址,另一个是可以直接定位到数据行自身的这一行在数据块中的地址。
除了在同一聚簇中可能不唯一外,每条记录的rowid是唯一的。可以理解成rowid就是唯一的。

rowid解析

从Oracle 8i开始使用扩展rowid标识行物理地址
扩展rowid使用base64编码行的物理地址,编码字符包含A-Z, a-z, 0-9, +, 和/。
扩展rowid由四部分组成:OOOOOOOFFFBBBBBBRRR:
rowid包含如下内容:
①:对象所在的数据文件号
②:对象所在的块号
③:对象所在行在块内的位置
④:对象号
其中:
OOOOOO:数据对象编号(6位显示)
FFF:相关数据文件编号(3位显示)
BBBBBB:数据块编号(6位显示)
RRR:数据块中行编号(3位显示)
在这里插入图片描述

rowid示例

利用rowid结合maxmin函数快速去重

select t.* from bill t where t.rowid = (select max(s.rowid) from bill s 
where t.FLAG = s.FLAG
  and s.btype = 1
  and s.CODE in ('71131702422','71130427253','71134427859')
);

利用rowid结合maxmin函数快速删除重复数据

-- 使用min函数的时候用大于号>
delete t.* from bill t where t.rowid < (select max(s.rowid) from bill s 
where t.FLAG = s.FLAG
  and s.btype = 1
  and s.CODE in ('71131702422','71130427253','71134427859')
);

本文参考链接1.

Mysql里,可以用Max函数,类似于Oraclerowidmax
SQL Server中也有First_ValueLast_Value函数,可以用来实现。

扫描二维码关注公众号,回复: 4766385 查看本文章

注:group by 必须放在 order by 和 limit之前,不然会报错

猜你喜欢

转载自blog.csdn.net/weixin_43525116/article/details/85167642