distinct

1. distinct简介
在表中,可能会包含重复值。这并不成问题,不过,有时您也许希望仅仅列出不同(distinct)的值。关键词 DISTINCT 用于返回唯一不同的值。

distinct这个关键字用来过滤掉多余的重复记录只保留一条,但 往往只用它来 返回不重复记录的条数,而 不是用它来返回不重记录的 所有值。其原因是distinct只有用二重循环查询来解决,而这样对于一个数据量非常大的站来说,无疑是会直接影响到效率的。

2.使用限制
1)distinct必须放在select后的第一个字段前
2)distinct的作用范围是select后的所有的字段,而不仅仅是紧挨着的字段。就像联合主键一样,共同保证唯一性。
3)distinct语句中select显示的字段只能是distinct指定的字段,其他字段是不可能出现的。例如,假如表A有“备注”列,如果想获取distinct name,以及对应的“备注”字段,但又不想让“备注”和name共同保证distinct是不行的。有上面两点的限制这一点不难理解。但可以通过其他组合查询的方式得到这种结果。

4)可以在函数里使用distinct,比如:
select p.event_source,count(distinct p.DESCRIPTION) from v_process_info p group by p.EVENT_SOURCE

3. 与group by的性能对比
这里只是引用了网上几个对比,自己没有验证。说明一点,就算是验证,结论不一定准确,数据库的架构和数据的分布和数量级都会影响到测试结果。结果仅供参考.
1)在mysql中测试,group by比distinct性能好很多。
2)使用索引,同样的关键字下效率提升几十~上百倍。
http://www.cnblogs.com/zox2011/archive/2012/09/12/2681797.html

在oracle10g之后,group by同样是比distinct性能好。
分析见: http://blog.itpub.net/4227/viewspace-69053/

tom大师也给出oracle下,group by比distinct性能好些。
http://blog.chinaunix.net/uid-22948773-id-3157019.html

其他参考:
http://www.jb51.net/article/24717.htm
http://www.itpub.net/thread-611402-1-1.html

猜你喜欢

转载自zoroeye.iteye.com/blog/2170382