一 DISTINCT
在表中,可能会包含重复值。这并不成问题,如果你需要显示某个字段所有值(去重),这时可以考虑使用distinct来进行sql
去重操作。
关键词 DISTINCT 用于返回唯一不同的值(如果获取多列名称时,将不会起作用)。
语法:
SELECT DISTINCT 列名称 FROM 表名称
使用 DISTINCT 关键词
如果要从 "Company" 列中选取所有的值,我们需要使用 SELECT 语句:
SELECT Company FROM Orders
"Orders"表:
Company | OrderNumber |
---|---|
A | 1 |
S | 2 |
D | 3 |
A | 4 |
结果:
Company |
---|
A |
S |
D |
A |
请注意,在结果集中,A 被列出了两次。
如需从 Company" 列中仅选取唯一不同的值,我们需要使用 SELECT DISTINCT 语句:
SELECT DISTINCT Company FROM Orders
结果:
Company |
---|
A |
S |
D |
现在,在结果集中,"A" 仅被列出了一次。
SELECT DISTINCT Company ,OrderNumber FROM Orders
Company | OrderNumber |
---|---|
A | 1 |
S | 2 |
D | 3 |
A | 4 |
那么问题来了,当你查询出多列时,想要根据某个字段进行去重,如果使用sql的话,你可以使用group by,根据某个字段进行分组,默认获取第一列数据:
SELECT * FROM Orders group Company
Company | OrderNumber |
---|---|
A | 1 |
S | 2 |
D | 3 |
下面对group by 进行简单介绍:
函数 (比如 SUM,MIN,MAX) 常常需要添加 GROUP BY 语句。
GROUP BY 语句
GROUP BY 语句用于结合函数,根据一个或多个列对结果集进行分组。
SQL GROUP BY 语法
SELECT column_name, aggregate_function(column_name) FROM table_name WHERE column_name operator value GROUP BY column_name
SQL GROUP BY 实例
我们拥有下面这个 "Orders" 表:
O_Id | OrderDate | OrderPrice | Customer |
---|---|---|---|
1 | 2008/12/29 | 1000 | Bush |
2 | 2008/11/23 | 1600 | Carter |
3 | 2008/10/05 | 700 | Bush |
4 | 2008/09/28 | 300 | Bush |
5 | 2008/08/06 | 2000 | Adams |
6 | 2008/07/21 | 100 | Carter |
现在,我们希望查找每个客户的总金额(总订单)。
我们想要使用 GROUP BY 语句对客户进行组合。
我们使用下列 SQL 语句:
SELECT Customer,SUM(OrderPrice) FROM Orders GROUP BY Customer
结果集类似这样:
Customer | SUM(OrderPrice) |
---|---|
Bush | 2000 |
Carter | 1700 |
Adams | 2000 |
很棒吧,对不对?
让我们看一下如果省略 GROUP BY 会出现什么情况:
SELECT Customer,SUM(OrderPrice) FROM Orders
结果集类似这样:
Customer | SUM(OrderPrice) |
---|---|
Bush | 5700 |
Carter | 5700 |
Bush | 5700 |
Bush | 5700 |
Adams | 5700 |
Carter | 5700 |
上面的结果集不是我们需要的。
那么为什么不能使用上面这条 SELECT 语句呢?解释如下:上面的 SELECT 语句指定了两列(Customer 和 SUM(OrderPrice))。"SUM(OrderPrice)" 返回一个单独的值("OrderPrice" 列的总计),而 "Customer" 返回 6 个值(每个值对应 "Orders" 表中的每一行)。因此,我们得不到正确的结果。不过,您已经看到了,GROUP BY 语句解决了这个问题。
GROUP BY 一个以上的列
我们也可以对一个以上的列应用 GROUP BY 语句,就像这样:
SELECT Customer,OrderDate,SUM(OrderPrice) FROM Orders GROUP BY Customer,OrderDate