SQL中distinct vs group by使用

一 DISTINCT

在表中，可能会包含重复值。这并不成问题，如果你需要显示某个字段所有值（去重），这时可以考虑使用distinct来进行sql

去重操作。

关键词 DISTINCT 用于返回唯一不同的值(如果获取多列名称时，将不会起作用)。

语法：

SELECT DISTINCT 列名称 FROM 表名称

使用 DISTINCT 关键词

如果要从 "Company" 列中选取所有的值，我们需要使用 SELECT 语句：

SELECT Company FROM Orders

"Orders"表：

Company	OrderNumber
A	1
S	2
D	3
A	4

结果：

Company
A
S
D
A

请注意，在结果集中，A 被列出了两次。

如需从 Company" 列中仅选取唯一不同的值，我们需要使用 SELECT DISTINCT 语句：

SELECT DISTINCT Company FROM Orders

结果：

Company
A
S
D

现在，在结果集中，"A" 仅被列出了一次。

SELECT DISTINCT Company ,OrderNumber FROM Orders

Company	OrderNumber
A	1
S	2
D	3
A	4

那么问题来了，当你查询出多列时，想要根据某个字段进行去重，如果使用sql的话，你可以使用group by,根据某个字段进行分组，默认获取第一列数据：

SELECT * FROM Orders group Company

扫描二维码关注公众号，回复： 3265370 查看本文章

Company	OrderNumber
A	1
S	2
D	3

下面对group by 进行简单介绍：

函数 (比如 SUM，MIN,MAX) 常常需要添加 GROUP BY 语句。

GROUP BY 语句

GROUP BY 语句用于结合函数，根据一个或多个列对结果集进行分组。

SQL GROUP BY 语法

SELECT column_name, aggregate_function(column_name)
FROM table_name
WHERE column_name operator value
GROUP BY column_name

SQL GROUP BY 实例

我们拥有下面这个 "Orders" 表：

O_Id	OrderDate	OrderPrice	Customer
1	2008/12/29	1000	Bush
2	2008/11/23	1600	Carter
3	2008/10/05	700	Bush
4	2008/09/28	300	Bush
5	2008/08/06	2000	Adams
6	2008/07/21	100	Carter

现在，我们希望查找每个客户的总金额（总订单）。

我们想要使用 GROUP BY 语句对客户进行组合。

我们使用下列 SQL 语句：

SELECT Customer,SUM(OrderPrice) FROM Orders
GROUP BY Customer

结果集类似这样：

Customer	SUM(OrderPrice)
Bush	2000
Carter	1700
Adams	2000

很棒吧，对不对？

让我们看一下如果省略 GROUP BY 会出现什么情况：

SELECT Customer,SUM(OrderPrice) FROM Orders

结果集类似这样：

Customer	SUM(OrderPrice)
Bush	5700
Carter	5700
Bush	5700
Bush	5700
Adams	5700
Carter	5700

上面的结果集不是我们需要的。

那么为什么不能使用上面这条 SELECT 语句呢？解释如下：上面的 SELECT 语句指定了两列（Customer 和 SUM(OrderPrice)）。"SUM(OrderPrice)" 返回一个单独的值（"OrderPrice" 列的总计），而 "Customer" 返回 6 个值（每个值对应 "Orders" 表中的每一行）。因此，我们得不到正确的结果。不过，您已经看到了，GROUP BY 语句解决了这个问题。

GROUP BY 一个以上的列

我们也可以对一个以上的列应用 GROUP BY 语句，就像这样：

SELECT Customer,OrderDate,SUM(OrderPrice) FROM Orders
GROUP BY Customer,OrderDate