SQL中distinct vs group by使用

一  DISTINCT 

在表中,可能会包含重复值。这并不成问题,如果你需要显示某个字段所有值(去重),这时可以考虑使用distinct来进行sql

去重操作。

关键词 DISTINCT 用于返回唯一不同的值(如果获取多列名称时,将不会起作用)。

语法:

SELECT DISTINCT 列名称 FROM 表名称

使用 DISTINCT 关键词

如果要从 "Company" 列中选取所有的值,我们需要使用 SELECT 语句:

SELECT Company FROM Orders

"Orders"表:

Company OrderNumber
A 1
S 2
D 3
A 4

结果:

Company
A
S
D
A

请注意,在结果集中,A 被列出了两次。

如需从 Company" 列中仅选取唯一不同的值,我们需要使用 SELECT DISTINCT 语句:

SELECT DISTINCT Company FROM Orders 

结果:

Company
A
S
D

现在,在结果集中,"A" 仅被列出了一次。

SELECT DISTINCT Company ,OrderNumber FROM Orders

Company OrderNumber
A 1
S 2
D 3
A 4

那么问题来了,当你查询出多列时,想要根据某个字段进行去重,如果使用sql的话,你可以使用group by,根据某个字段进行分组,默认获取第一列数据:

SELECT * FROM Orders  group Company

扫描二维码关注公众号,回复: 3265370 查看本文章
Company OrderNumber
A 1
S 2
D 3

下面对group  by 进行简单介绍:

函数 (比如 SUM,MIN,MAX) 常常需要添加 GROUP BY 语句。

GROUP BY 语句

GROUP BY 语句用于结合函数,根据一个或多个列对结果集进行分组。

SQL GROUP BY 语法

SELECT column_name, aggregate_function(column_name)
FROM table_name
WHERE column_name operator value
GROUP BY column_name

SQL GROUP BY 实例

我们拥有下面这个 "Orders" 表:

O_Id OrderDate OrderPrice Customer
1 2008/12/29 1000 Bush
2 2008/11/23 1600 Carter
3 2008/10/05 700 Bush
4 2008/09/28 300 Bush
5 2008/08/06 2000 Adams
6 2008/07/21 100 Carter

现在,我们希望查找每个客户的总金额(总订单)。

我们想要使用 GROUP BY 语句对客户进行组合。

我们使用下列 SQL 语句:

SELECT Customer,SUM(OrderPrice) FROM Orders
GROUP BY Customer

结果集类似这样:

Customer SUM(OrderPrice)
Bush 2000
Carter 1700
Adams 2000

很棒吧,对不对?

让我们看一下如果省略 GROUP BY 会出现什么情况:

SELECT Customer,SUM(OrderPrice) FROM Orders

结果集类似这样:

Customer SUM(OrderPrice)
Bush 5700
Carter 5700
Bush 5700
Bush 5700
Adams 5700
Carter 5700

上面的结果集不是我们需要的。

那么为什么不能使用上面这条 SELECT 语句呢?解释如下:上面的 SELECT 语句指定了两列(Customer 和 SUM(OrderPrice))。"SUM(OrderPrice)" 返回一个单独的值("OrderPrice" 列的总计),而 "Customer" 返回 6 个值(每个值对应 "Orders" 表中的每一行)。因此,我们得不到正确的结果。不过,您已经看到了,GROUP BY 语句解决了这个问题。

GROUP BY 一个以上的列

我们也可以对一个以上的列应用 GROUP BY 语句,就像这样:

SELECT Customer,OrderDate,SUM(OrderPrice) FROM Orders
GROUP BY Customer,OrderDate

猜你喜欢

转载自blog.csdn.net/fz13768884254/article/details/82497404