@R星校长
SELECT DISTINCT column, AGG_FUNC(column_or_expression), …
FROM mytable
JOIN another_table
ON mytable.column = another_table.column
WHERE constraint_expression
GROUP BY column
HAVING constraint_expression
ORDER BY column ASC/DESC
LIMIT count OFFSET COUNT;
一个查询SQL
的执行总是先从数据里按条件选出数据,然后对这些数据再次做一些整理处理,按要求返回成结果,让结果尽可能是简单直接的。因为一个 查询SQL
由很多部分组成,所以搞清楚这些部分的执行顺序还挺重要的,这有助于我们更深刻的理解SQL
执行过程
查询执行顺序
1. FROM 和 JOINs
FROM
或 JOIN
会第一个执行,确定一个整体的数据范围. 如果要JOIN
不同表,可能会生成一个临时Table
来用于 下面的过程。总之第一步可以简单理解为确定一个数据源表(含临时表)
2. WHERE
我们确定了数据来源WHERE
语句就将在这个数据源中按要求进行数据筛选,并丢弃不符合要求的数据行,所有的筛选col
属性 只能来自FROM
圈定的表。 AS别名还不能在这个阶段使用,因为可能别名是一个还没执行的表达式
3. GROUP BY
如果你用了 GROUP BY
分组,那GROUP BY
将对之前的数据进行分组,统计等,并将是结果集缩小为分组数.这意味着 其他的数据在分组后丢弃
4. HAVING
如果你用了GROUP BY
分组, HAVING
会在分组完成后对结果集再次筛选。AS
别名也不能在这个阶段使用
5. SELECT
确定结果之后,SELECT
用来对结果col
简单筛选或计算,决定输出什么数据
6. DISTINCT
如果数据行有重复DISTINCT
将负责排重
7. ORDER BY
在结果集确定的情况下,ORDER BY
对结果做排序。因为SELECT
中的表达式已经执行完了。此时可以用AS
别名
8. LIMIT / OFFSET
最后 LIMIT
和 OFFSET
从排序的结果中截取部分数据
结论
不是每一个SQL
语句都要用到所有的句法,但灵活运用以上的句法组合和深刻理解SQL
执行原理将能在SQL
层面更好的解决数据问题,而不用把问题 都抛给程序逻辑
练习
这是 SELECT
查询的最后一节课, 我们将出一些比较有挑战的任务。看你能不能综合运用之前学到的知识了!
Table: Movies
Id | Title | Director | Year | Length_minutes |
---|---|---|---|---|
1 | Toy Story | John Lasseter | 1995 | 81 |
2 | A Bug’s Life | John Lasseter | 1998 | 95 |
3 | Toy Story 2 | John Lasseter | 1999 | 93 |
4 | Monsters, Inc. | Pete Docter | 2001 | 92 |
5 | Finding Nemo | Finding Nemo | 2003 | 107 |
6 | The Incredibles | Brad Bird | 2004 | 116 |
7 | Cars | John Lasseter | 2006 | 117 |
8 | Ratatouille | Brad Bird | 2007 | 115 |
9 | WALL-E | Andrew Stanton | 2008 | 104 |
10 | Up | Pete Docter | 2009 | 101 |
11 | Toy Story 3 | Lee Unkrich | 2010 | 103 |
12 | Cars 2 | John Lasseter | 2011 | 120 |
13 | Brave | Brenda Chapman | 2012 | 102 |
14 | Monsters | University Dan Scanlon | 2013 | 110 |
Table: Boxoffice
Movie_id | Rating | Domestic_sales | International_sales |
---|---|---|---|
5 | 8.2 | 380843261 | 555900000 |
14 | 7.4 | 268492764 | 475066843 |
8 | 8 | 206445654 | 417277164 |
12 | 6.4 | 191452396 | 368400000 |
3 | 7.9 | 245852179 | 239163000 |
6 | 8 | 261441092 | 370001000 |
9 | 8.5 | 223808164 | 297503696 |
11 | 8.4 | 415004880 | 648167031 |
1 | 8.3 | 191796233 | 170162503 |
7 | 7.2 | 244082982 | 217900167 |
10 | 8.3 | 293004164 | 438338580 |
4 | 8.1 | 289916256 | 272900000 |
2 | 7.2 | 162798565 | 200600000 |
13 | 7.2 | 237283207 | 301700000 |
练习do it
——符号 请完成如下任务
【复习】统计出每一个导演的电影数量(列出导演名字和数量)
SELECT Director, COUNT() Num
FROM Movies
GROUP BY Director;
【复习】统计一下每个导演的销售总额(列出导演名字和销售总额)
SELECT Director, SUM(Domestic_sales+International_sales)
FROM Movies
JOIN Boxoffice
ON Movies.Id = Boxoffice.Movie_id
GROUP BY Director;
【难题】按导演分组计算销售总额,求出平均销售额冠军(统计结果过滤掉只有单部电影的导演,列出导演名,总销量,电影数量,平均销量)
SELECT Director, SUM(Domestic_sales+International_sales)
AS TOTAL_SALES, COUNT(Title)
AS COUNT_MOVIE, SUM(Domestic_sales+International_sales)/COUNT(Director)
AS AVG_SALES
FROM Movies
JOIN Boxoffice
ON Movies.Id = Boxoffice.Movie_id
GROUP BY Director
HAVING COUNT(Director)>1
ORDER BY AVG_SALES DESC
LIMIT 1;
【变态难】找出每部电影和单部电影销售冠军之间的销售差,列出电影名,销售额差额
SELECT Title,
(SELECT MAX(Domestic_sales+International_sales)
FROM Boxoffice) - SUM(Domestic_sales+International_sales)
AS DIFFERENCE
FROM Movies
JOIN Boxoffice
ON Movies.Id = Boxoffice.Movie_id
GROUP BY Title;
⚠️ 注意: MAX
,SUM
一类和GROUP BY
联合使用
⚠️ 注意: SELECT FROM
哪个表要搞清楚
⚠️ 注意: 没有SELECT
的时候,MAX
没有结果显示