1.4(SQL学习笔记)分组、子查询、联结

一、分组

  建表及数据填充语句下载:链接: https://pan.baidu.com/s/1WHYafwqKJEKq1kDwCH_Zlg 提取码: 3wy4 

  1.1初识分组

  分组是按照某一列,将该列中相同多个相同的数据作为一组,整体分成若干组。

  例如有如下表:

  

  例如将vend_id作为依据分组,则会分成三组。

  所有vend_id = DLL01为一组,所有vend_id = BRS01为一组。

  所有vend_id = FNG01为一组。

  现在我们有这样一个需求,计算每一个每一个供应商有多少商品。

  这时我们可以采用这样的思路,先按供应商进行分组,然后采用聚集函数计算。

  分组采用GROUP BY colName 进行分组

  

  按照vend_id分组后再采用聚集函数计算。

  注:SELECT语句后面出现的字段必须是在GROUP BY语句后面出现的字段。  

  聚集函数除外。因为按照vend_id分成三组后,除了vend_id作为分组的关键字可以正常显示,

  每一个分组中其余属性的属性值并不相同,因此不能作为SELECT后面的列。

  

  GROUP BY治具可以任意数目的列,使其可以进行分组的嵌套。  

  GROUP BY语句必须出现在WHERE之后,ORDER BY之前。

  1.2分组过滤

  过滤分组类似前面的WHERE,不过WHERE过滤的行,而这里过滤的是分组。

  过滤分组采用HAVING 过滤条件。

  这里过滤的是分组,是一组数据。

  

  例如现在我们要过滤掉提供商品小于3的供应商。

  先按供应商进行分组,然后计算供应商商品数目。

  通过HAVING判断数量进行过滤。

  

  

  我们来分析下语句的执行顺序,

  首先FROM找到表,然后通过GROUP BY进行分组,

  然后通过HAVING判断每一个分组的行数是否大于3,大于等于3的分组保留下来,其他的忽略。

  最后通过SELECT输出每个组的关键字(vend_id)和每个组的行数。

  注:HAVING 筛选条件,满足筛选条件的会被保留下来。

  本例执行顺序FROM ->GROUP BY->HAVING->SELECT;

  

  如果在加上WHERE会怎么样呢?

  WHERE是在分组前执行,HAVING是在分组后执行,

  例如:

  

  先通过FROM找到表,然后执行WHERE保留所有prod_price大于4的商品。

  然后通过vend_id分组,然后再通过COUNT()计算每个分组的数量,保留商品数>=3的分组。

  最后返回保留下来的分组,即商品价格大于4,且商品数量大于3的供应商。

  本例中的分组是在WHERE执行后进行分组,也就是说分组的数据是WHERE过滤完成后保留下来的数据。

  WHERE是在分组前执行,HAVING是在分组后执行。

  

  如果再加上ORDER BY呢?

  

  本例中ORDER BY是最后执行的,ORDER BY先按vend_id升序排列,

  在vend_id相同的情况下才会按count进行排序,而count是SELECT中定义的别名。

  别名只有定义后才能使用,如果某一个关键字是在SELECT之前执行,例如WHERE,

  那么在该关键字中使用count会报错,因为此时count还没有定义,此处就需要注意

  语句的执行顺序,以及别名要在定义后使用。

  在A中指定别名,如果BCD都在A后执行,则可以在BCD中使用。反之则不行。

    

  

二、子查询 

  子查询是将查询结果作为查询条件,可多层嵌套。

  

    例如当前有这三张表,1号订单有中有1号3号商品,

    3号订单中有3号商品。

    1号商品在1号订单中,3号商品在1号和3号订单中。

    现在需要通过订单查询对应商品。

    例如查询1号订单的所有商品:

    基本思路,先通过订单表中id作为筛选条件,查询出中间表中order_id = 1的所有行(1,2行)。

    再将这些行中的product_id(1,3)作为查询参数,查找商品表中对应商品。

    这时就需要使用子查询,将上一级的查询结果,作为下一级的参数参数。

    

    

    执行时先执行最内层的查询,然后将结果作为上一次的查询参数,如此往复可嵌套多个。

    

    字段子查询

    

    首先通过FROM查找custoemr表,返回每一行数据时,将将该行数据中的custoemr.cust_id作为查询参数

    在orders表中查找与orders.cust_id相同的数据,计算行数(即对应客户订单数),依次计算所有客户的订单数。

    最后通过订单数降序排列。

    注:由于cust_id重名,为了使其区分出是哪一张表中的字段,所以在前面添加了表名。

三、联结

  3.1、初始联结

  在关系型数据库中,某些数据是分开的,通过某些关键字将多个表连接起来。

  这样比较可以节约空间,例如一张商品表,一张订单表,通过商品id关联。

  这样的多个表相关联的情况就需要使用子查询或者联结。

  之前使用子查询较为繁琐,需要考虑每一级的返回参数等。

  

  而联结可以隐式的将多个表关联起来,我们只需要指定查询条件即可。

  例如:

  cusomers

  

  orders

  

  订单表中存储客户ID,可以通过子查询查找客户订单。

  现在我们使用联结来查找。

  

  首先将customers,orders表联结,然后通过customers.cust_id在orders表中查找cust_id相同的行。

  

  我们尝试下不加WHERE看看联结后的表是什么样子的。

  

  customers表中的每一个行都和对应了order整个表。

  不加WHERE会出现笛卡尔积,即第一表行数*第二个表行数。

  

  对于此联结还可以按如下方式写:

  

  相当于在cuseomer表中加入orders表,ON相当于WHERE。

  内联结(INNER JOIN)只会返回相同的部分,即customer.cust_id = orders.cust_id的部分。

  使用(FROM table1,table2...)联结多个表默认也是使用内联结。

    

  3.2联结与表别名

  联结过程中某些查询字段名称相同,需要通过(表名.列名)的形式来区分。

  有时表名较长写起来不方便,这时可以先为表名指定别名,然后通过(别名.列名)

  的方式来指定。

  orderitems

  

  orders

  

  customer

  

  

  先将orders与orderitems联结,并通过order_id查询,获取到一张订单及对应商品的表(订单-商品)。

  然后再将这张表与客户表关联,通过客户表中id查询(订单-商品)表中的对应客户id相同的部分,

  找到客户的所有订单。而每一个订单有携带了自身包含的商品。

  一号客户有两个订单(20005,20009),每个订单中又有多个商品。

  O,OI,C是别名。

  3.2外联结

  上列我们使用的基本都是内联结,即联结的两个表只会返回满足匹配条件的行,

  例如:表一.name = 表二.name 只会返回表一中name等于表二中name的行。

  除了这种内联结外,还有外联结,比如左外联结,无论左表中的行是否满足条件都会返回。

  下面看一个例子。

  customer

  

  orders

  

  现在我们通过cust_id查找客户对应订单

  

  只有两个表中都有cust_id的行被保留了下来,

  例如客户表中有100000002,但是orders表中没有cust_id=10000002的客户。

  所以没有保留100000002.

  有时我们需要保留没有订单的客户进行分析,这时就需要使用到外联结。

  

  LEFT为做外联,即左表(custoemrs)中的每一项都会显示出来,即使不满足ON后面添加也会显示出来。

  LEFT OUTER JOIN 中的OUTER可以省略。

  除了左外联还有右外联,RIGHT JOIN

  

  由于订单表中每个订单必有用户对应,所以和之前内联查询结果没有多大区别。

   之前通过做外联计算出客户订单后,我们可以通过聚集函数计算出每个客户的订单。

  

   

参考资料:

《SQL必知必会》

猜你喜欢

转载自www.cnblogs.com/huang-changfan/p/10589705.html