MySQL必知必会——数据过滤、通配符过滤

一、使用WHERE子句

数据库表一般包含大量的数据,很少需要检索表中的所有行。通常会根据特定操作或报告的需要提取表数据的子集。只检索所需数据需要指定搜索条件(search criteria),搜索条件也称为过滤条件(filter condition)。
SELECT语句中,数据根据WHERE子句中指定的搜索条件进行过滤。WHERE子句在表名(FROM子句)之后给出,如下所示:

SELECT prod_name,prod_price
FROM products
WHERE prod_price = 2.50;

这条语句从products表中检索出两个列,但不返回所有行,只返回prod_price值为2.50的行,如下所示:

+---------------+------------+
| prod_name     | prod_price |
+---------------+------------+
| Carrots       |       2.50 |
| TNT (1 stick) |       2.50 |
+---------------+------------+

这个例子采用了简单的相等测试:它检查一个列是否具有指定的值,据此进行过滤。但是SQL允许做的事情不仅仅是相等测试。

WHERE子句的位置
在同时使用ORDER BYWHERE子句时,应该让ORDER BY位于WHERE之后,否则将会产生错误。

二、WHERE子句操作符

在关于相等的测试时看到了第一个WHERE子句,它确定一个列是否包含特定的值。
MySQL支持表中列出的所有条件操作符。‘

操作符 说明
= 等于
<> 不等于
!= 不等于
< 小于
<= 小于等于
> 大于
>= 大于等于
BETWEEN 在指定的两个值之间

1、检查单个值

SELECT prod_name,prod_price
FROM products
WHERE prod_name = 'fuses';

检查WHERE prod_name = 'fuses'语句,它返回prod_name的值为Fuses的一行。
MySQL在执行匹配时默认不区分大小写,所以Fuses与fuses匹配。

+-----------+------------+
| prod_name | prod_price |
+-----------+------------+
| Fuses     |       3.42 |
+-----------+------------+

其他例子:
列出价格小于10$的所有产品

SELECT pord_name,prod_price
FROM products
WHERE prod_price < 10;
+---------------+------------+
| prod_name     | prod_price |
+---------------+------------+
| .5 ton anvil  |       5.99 |
| 1 ton anvil   |       9.99 |
| Carrots       |       2.50 |
| Fuses         |       3.42 |
| Oil can       |       8.99 |
| Sling         |       4.49 |
| TNT (1 stick) |       2.50 |
+---------------+------------+

2、不匹配检查

以下例子列出不是由供应商1003制造的所有产品

SELECT vend_id,prod_name
FROM products
WHERE vend_id <> 1003;
+---------+--------------+
| vend_id | prod_name    |
+---------+--------------+
|    1001 | .5 ton anvil |
|    1001 | 1 ton anvil  |
|    1001 | 2 ton anvil  |
|    1002 | Fuses        |
|    1005 | JetPack 1000 |
|    1005 | JetPack 2000 |
|    1002 | Oil can      |
+---------+--------------+

下面是相同的例子,使用的是!=而不是<>操作符

SELECT vend_id,prod_name
FROM products
WHERE vend_id != 1003;

如何使用引号:仔细观察WHERE子句中使用的条件,会看到有的值括在单引号内(如:之前例子的’fuses’),而有的值未括起来。单引号;用来限定字符串,如果将值和串类型的列进行比较,则需要限定引号。用来与数值列进行比较的值不用 引号。

3、范围值检查

为了检查某个范围的值,可以使用BETWEEN操作符。其语法与其他WHERE子句的操作稍有不同,因为他需要两个值,即范围的开始值和结束值。例如BETWEEN操作符可以用来检索价格在5美元和10美元之间或日期在指定的开始日期和结束日期之间的所有产品。
例子,检索价格位于5美元和10美元之间的所有产品。

SELECT prod_name,prod_price
FROM products
WHERE prod_price BETWEEN 5 AND 10;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| .5 ton anvil   |       5.99 |
| 1 ton anvil    |       9.99 |
| Bird seed      |      10.00 |
| Oil can        |       8.99 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+
5 rows in set (0.00 sec)

在这个例子中可以看到,在使用BETWEEN时,必须指定两个值——所需范围的低端值和高端值。这两个值 必须使用AND关键字隔离。BETWEEN匹配范围中所有的值,包括指定的开始值和结束值。

4、空值检查

在创建表时,表设计人员会指定其中的列是否可以不包含值,在一个列不包含值时,称其为包含空值NULL。
NULL:无值(no value ),它与字段包含0、空字符或仅仅包含空格不同。
SELECT 有一个特殊的WHERE子句,可用来检查具有NULL值的列。这个WHERE子句就是IS NULL子句,其语法如下:

SELECT prod_name
FROM products
WHERE prod_pirce IS NULL;

这条语句返回没有价格的所有产品,由于表中没有这样的行,所以没有返回数据。
但是,customers表确实包含有具有空值的列,如果在文件中没有某位顾客的电子邮件地址,则cust_email列将包含NULL值。

SELECT cust_id
FROM customers
WHERE cust_email IS NULL;
+---------+
| cust_id |
+---------+
|   10002 |
|   10005 |
+---------+

NULL与不匹配
在通过过滤选择出不具有特定值的行时,可能希望返回具有NULL值的行。但是,不会返回。因为未知具有特殊的含义,数据库不知道他们是否匹配,所以在匹配过滤或不匹配过滤时 不返回它们。
因此,在过滤数据时,一定要验证返回数据中确实给出了被过滤列具有NULL的行。

三、组合WHERE子句

之前介绍的WHERE子句在过滤数据的时候使用的都是单一的条件,为了进行更强的过滤控制,MySQL允许给出多个WHERE子句。这些子句可以两种方法使用:以AND子句的方式或者OR子句的方式使用。

操作符:用来联结或改变WHERE子句中的子句的关键字,也称为逻辑操作符。

1、AND操作符

为了通过不止一个列进行过滤,可使用AND操作符给WHERE子句附加条件。

SELECT prod_id,prod_price,prod_name
FROM products
WHERE vend_id = 1003 AND prod_price <= 10;

该SQL语句检索由供应商1003制造且价格小于等于10$的所有产品的名称和价格。这条SELECT语句中的WHERE子句包含两个条件,并且用AND关键字联结它们。AND指示DBMS只返回满足所有条件的行。

+---------+------------+----------------+
| prod_id | prod_price | prod_name      |
+---------+------------+----------------+
| FB      |      10.00 | Bird seed      |
| FC      |       2.50 | Carrots        |
| SLING   |       4.49 | Sling          |
| TNT1    |       2.50 | TNT (1 stick)  |
| TNT2    |      10.00 | TNT (5 sticks) |
+---------+------------+----------------+

AND: 用在WHERE子句中的关键字,用来指示检索满足所有给定条件的行。

上述例子只包含一个关键字AND的语句,把两个过滤条件组合在一起,还可以添加多个过滤条件,每添加一条就要使用一个AND。

2、OR操作符

OR操作符与AND操作符不同,它指示MySQL检索匹配任一条件的行。

SELECT prod_name,prod_price
FROM products
WHERE vend_id = 1002 OR vend_id = 1003;

此SQL语句检索由任何一个指定供应商制造的所有产品的产品名和价格。OR操作符告诉DBMS匹配任一条件而不是同时匹配两个条件,如果这里使用的是AND操作符,则没有数据返回(此时创建的WHERE子句不会检索到有匹配的产品)。

+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Detonator      |      13.00 |
| Bird seed      |      10.00 |
| Carrots        |       2.50 |
| Fuses          |       3.42 |
| Oil can        |       8.99 |
| Safe           |      50.00 |
| Sling          |       4.49 |
| TNT (1 stick)  |       2.50 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+

OR: WHERE子句中使用的关键字,用来表示检索匹配任一给定条件的行。

3、计算次序

WHERE可包含任意数目的AND和OR操作符。允许两者结合以进行复杂和高级的过滤。
但是,组合AND 和OR带来了一个有趣的问题,为了说明这个问题,来看一个例子。假如需要列出价格为10$以上且由1002或者1003制造的所有产品,下面的语句使用AND和OR操作符的组合建立了一个WHERE子句。

SELECT prod_name,prod_price
FROM products
WHERE vend_id = 1002 OR vend_id = 1003 AND prod_price >= 10;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Detonator      |      13.00 |
| Bird seed      |      10.00 |
| Fuses          |       3.42 |
| Oil can        |       8.99 |
| Safe           |      50.00 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+

上例输出结果有两行价格小于10$,显然,返回的行并未按照预定进行过滤。为什么会这样呢?原因就在于SQL计算的次序。SQL像多数语言一样在处理逻辑运算符的时候优先计算AND操作符。当SQL看到上述语句时会理解为,由供应商1003制造的任何价格为10美元以上的产品,或者供应商1002制造的任何产品,而不管其价格何如。 换句话说,由于AND计算次序优先级更高,操作符被错误地组合了。
解决该问题地办法就是使用小括号明确地分组相应地操作符

SELECT prod_name,prod_price
FROM products
WHERE (vend_id = 1002 OR vend_id = 1003) AND prod_price >= 10;

因为小括号具有较AND和OR更高的计算次序,DBMS优先过滤圆括号内的OR条件。这时候,SQL语句变成了选择由供应商1002或1003制造的且价格都在10$以上的任何产品,这才是真正想要的结果。

+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Detonator      |      13.00 |
| Bird seed      |      10.00 |
| Safe           |      50.00 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+

在WHERE子句中使用小括号,任何时候使用具有AND和OR操作符的WHERE子句,都应该使用小括号明确地分组操作符,不要过分依赖默认计算次序,即使它确实是你想要的顺序也是如此。使用小括号可以更好地消除歧义。

4、IN操作符

圆括号在WHERE子句中还有另外一种用法,IN操作符用来指定条件范围,范围中的每个条件都可以进行匹配。IN的取值是由逗号分隔的清单,全都括在圆括号中。

IN操作符 : WHERE子句中用来指定要匹配值的清单的关键字,功能与OR相当。

SELECT prod_name,prod_price
FROM products
WHERE vend_id IN (1002,1003)
ORDER BY prod_name;

此SELECT语句检索供应商1002和1003制造的所有产品,IN操作符后跟由逗号分隔的合法值清单,整个清单必须括在圆括号内。

+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Bird seed      |      10.00 |
| Carrots        |       2.50 |
| Detonator      |      13.00 |
| Fuses          |       3.42 |
| Oil can        |       8.99 |
| Safe           |      50.00 |
| Sling          |       4.49 |
| TNT (1 stick)  |       2.50 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+

IN操作符和OR由相同的功能,看下例:

MariaDB [course]> SELECT prod_name,prod_price
    -> FROM products
    -> WHERE vend_id = 1002 OR vend_id = 1003
    -> ORDER BY prod_name;
+----------------+------------+
| prod_name      | prod_price |
+----------------+------------+
| Bird seed      |      10.00 |
| Carrots        |       2.50 |
| Detonator      |      13.00 |
| Fuses          |       3.42 |
| Oil can        |       8.99 |
| Safe           |      50.00 |
| Sling          |       4.49 |
| TNT (1 stick)  |       2.50 |
| TNT (5 sticks) |      10.00 |
+----------------+------------+
9 rows in set (0.00 sec)

为什么要使用IN操作符,其优点如下:

  1. 在使用长的合法选项清单时,IN操作符的语法更清楚且更直观。
  2. 在使用IN时,计算的次序更容易管理(因为使用的操作符更少)
  3. IN操作符一般比OR操作符执行清单更快
  4. IN的最大优点是,可以包含其他SELECT语句,使得能够更动态地建立WHERE子句。

5、NOT操作符

WHERE子句的NOT操作符只有一个功能,那就是否定它之后所跟的任何条件。

NOT操作符:WHERE子句中用来否定后跟条件的关键字。

下面例子说明了NOT的使用,为了列出除1002和1003之外的所有供应商创造的产品,可编写如下的代码:

SELECT prod_name,prod_price
FROM products
WHERE vend_id NOT IN (1002,1003)
ORDER BY prod_name;

这里的NOT否定跟在它之后的条件,因此,MySQL不是匹配1002和1003的vend_id,而是匹配1002和1003之外供应商的vend_id。

+--------------+------------+
| prod_name    | prod_price |
+--------------+------------+
| .5 ton anvil |       5.99 |
| 1 ton anvil  |       9.99 |
| 2 ton anvil  |      14.99 |
| JetPack 1000 |      35.00 |
| JetPack 2000 |      55.00 |
+--------------+------------+

为什么使用NOT? 对于简单的WHERE子句,使用NOT确实没有什么优势,但在更复杂的子句中,NOT是非常有用的。例如,在与IN操作符联合使用时,NOT使找出与条件列表不匹配的行非常简单。

四、使用通配符进行过滤

1、LIKE操作符

前面介绍的所有操作符都是针对已知值进行过滤的,不管是匹配一个还是多个值,测试大于还是小于已知值,或者检查某个范围的值,共同点是过滤中使用的值都是已知的。但是,这种过滤方法并不是任何时候都好用。例如,怎样搜素产品名中包含文本anvil的所有产品?用简单的比较操作符肯定不行,必须使用通配符。利用通配符可创建比较特定数据的搜索模式,在这个例子中,如果你想找到anvil的所有产品,可创造一个通配符搜索模式,找出产品名中任何位置出现anvil的产品。

通配符(wildcard):用来匹配值的一部分的特殊字符

搜索模式(search pattern /search schema):由字面值、通配符或者两者组合构成的搜索条件

通配符本事实际是SQL的WHERE子句中有特殊含义的字符,SQL支持几种通配符。
为在搜索子句中使用通配符,必须使用LIKE操作符,LIKE指示MySQL,后跟的搜索模式利用通配符匹配而不是直接匹配进行比较。

1.1百分号(%)通配符

最常使用的通配符是百分号(%),在搜索串中,%表示任何字符出现任意次数。
例如,为了找出所有以词jet起头的产品,可使用以下SELECT语句:

SELECT prod_id,prod_name
FROM products
WHERE prod_name LIKE 'jet%';

此例子使用了搜索模式'jet%'。在执行这条子句时,将检索任意以jet起头的词,%告诉MySQL接受jet之后的任意字符,不管它有多少字符。

+---------+--------------+
| prod_id | prod_name    |
+---------+--------------+
| JP1000  | JetPack 1000 |
| JP2000  | JetPack 2000 |
+---------+--------------+

区分大小写,根据MySQL的配置方式,搜索可以是区分大小写的,如果区分大小写,'jet%'与JetPack 1000不匹配。

通配符可在搜索模式中任意位置使用,并且可以使用多个通配符,下面的例子使用两个通配符,它们位于模式的两端

SELECT prod_id,prod_name
FROM products
WHERE prod_name LIKE '%anvil%';

搜索模式'%anvil%'表示匹配任何位置包含文本anvil的值,而不论它之前或之后出现什么字符。

+---------+--------------+
| prod_id | prod_name    |
+---------+--------------+
| ANV01   | .5 ton anvil |
| ANV02   | 1 ton anvil  |
| ANV03   | 2 ton anvil  |
+---------+--------------+

通配符也可以出现在搜索模式的中间,虽然这样做不太有用。
下面例子找出以s开头以e结尾的所有产品:

SELECT prod_name
FROM products
WHERE prod_name LIKE 's%e';
+-----------+
| prod_name |
+-----------+
| Safe      |
+-----------+
1 row in set (0.00 sec)

重要的是要注意到,除了一个或多个字符外,%还能匹配0个字符。
%代表搜索模式中给定位置的0个、1个或 多个字符。

注意NULL,虽然似乎%通配符可以匹配任何东西,但有一个例外,即NULL。即使是WHERE prod_name LIKE '%' 也不能匹配用NULL值作为产品名的行。

1.2下划线(_)通配符

另一个有用的通配符是下划线(_),下划线的用途与%一样,但下划线只匹配单个字符而不是多个字符。

SELECT prod_id,prod_name
FROM products
WHERE prod_name LIKE '_ ton anvil';
+---------+-------------+
| prod_id | prod_name   |
+---------+-------------+
| ANV02   | 1 ton anvil |
| ANV03   | 2 ton anvil |
+---------+-------------+
2 rows in set (0.00 sec)

此处WHERE子句中的搜索模式给出了后面跟有文本的一个通配符,结果只显示匹配搜索模式的行:第一行中下划线匹配1,第二行中匹配2。 .5 ton anvil产品没有匹配,因为搜索模式要求匹配1个通配符而不是2个。对照以下,下面的SELECT语句使用%通配符,返回三行产品:

MariaDB [course]> SELECT prod_id,prod_name
    -> FROM products
    -> WHERE prod_name LIKE '% ton anvil';
+---------+--------------+
| prod_id | prod_name    |
+---------+--------------+
| ANV01   | .5 ton anvil |
| ANV02   | 1 ton anvil  |
| ANV03   | 2 ton anvil  |
+---------+--------------+
3 rows in set (0.00 sec)

%不一样,_总是匹配一个字符,不能多也不能少。

2、使用通配符的技巧

正如所见,MySQL的通配符很有用,但是这种功能是有代价的:通配符搜索的处理一般要比前面讨论的其他搜索所花时间更长。这里给出一些使用通配符要记住的技巧

  • 不要过度使用通配符,如果其他操作符能达到相同的目的,应该使用其他操作符。
  • 在确实需要使用通配符时,除非绝对有必要,否则不 要把它们用在搜索模式的开始处。把通配符置于搜索模式的开始处,搜索起来是最慢的。
  • 仔细注意通配符的位置,如果放错地方,可能不会返回想要的数据。

总之,通配符是一种极重要和有用的搜索工具,以后我们经常会用到它。

发布了114 篇原创文章 · 获赞 30 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/weixin_41476978/article/details/104098192