数据库基础（2）：count、sum、group by、having、order by、limit的综合应用

一、count（）：返回、计算结果集的行数；

1、count（）和sum（）函数的区别：

一个（count）是统计结果集的总行数；一个（sum）是计算所有（符合条件）数值的总和；

mysql> select * from chengji;
+------+---------+-------+
| name | subject | score |
+------+---------+-------+
| 张三 | 数学    |    90 |
| 张三 | 语文    |    50 |
| 张三 | 地理    |    40 |
| 李四 | 语文    |    55 |
| 李四 | 政治    |    45 |
| 王五 | 政治    |    30 |
+------+---------+-------+
6 rows in set (0.00 sec)

用count（列）的时候，即：select count（score）from chengji; 这句查询的意思是：先做 select score from chengji; 的查询，然后统计出返回的结果集的总行数；

sum（列）的时候，计算的是符合条例数值的总和；

2、count（*）和count（1）、count（columnName）的区别：

（1）从统计的结果上：

count（*）和count（1）会统计出结果集表中所有的记录数, 包含字段为NULL的记录;

count(columnName):在统计的时候，如果字段值为NULL，则不会计入总数（不统计字段为NULL的记录）；

（1）从统计的效率上：

如果只有一个字段，则count(*)的效率是最优的；

如果有主键，则count（主键）的效率是最优的；

其他情况下，一般count（1）的效率是最优的；

二、groud by、having的总和应用；

1、根据下表。查询出2门及2门以上不及格者的平均成绩；

mysql> select * from chengji;
+------+---------+-------+
| name | subject | score |
+------+---------+-------+
| 张三 | 数学    |    90 |
| 张三 | 语文    |    50 |
| 张三 | 地理    |    40 |
| 李四 | 语文    |    55 |
| 李四 | 政治    |    45 |
| 王五 | 政治    |    30 |
+------+---------+-------+
6 rows in set (0.00 sec)

## 一种错误做法

mysql> select name,count(score < 60) as k,avg(score) from chengji group by name having k>=2;

错误分析：首先，此语句先执行：select name from chengji (where 1) : 得出：查询出所有人的名字;

mysql> select name from chengji;
+------+
| name |
+------+
| 张三 |
| 张三 |
| 张三 |
| 李四 |
| 李四 |
| 王五 |
+------+
6 rows in set (0.00 sec)

mysql>

然后：再次执行：select count(score<60) as k,avg(score) from chengji group by name; 按照姓名，进行分组，统计出每组的行数（即每个人的科目数），计算出每个组的平级分数；得出：

此时的K是，按照分组，统计出的每个人的科目数，而不是挂科数：故：最后在用having>2筛选，显然错误；

## 另一种错误做法：

mysql> select name,avg(score) from chengji where score<60 group by name having count(*)>=2;

错误分析：首先，此语句先执行：select name from chengji where score <60; 先把score <60 的人给查询出来；得出：

然后，再执行：select name,avg(score) from chengji where score<60 group by name；按照名字进行分组，求出每组人的平级分，此时，显然错误，第一次score<60只查询出的是挂科的人以及对应的分数，而再次分组求平均分，则只求的是每个人挂科的平均分而不是整体的平级分；

## 正确方法1：

先求出每个人的平级分，然后再筛选出挂科数>=2的；

每个人平级分: