java 面试总结（数据库）

1.建立索引的规则

索引是建立在数据库表中的某些列的上面。因此，在创建索引的时候，应该仔细考虑在哪些列上面可以创建索引，在哪些列上面不能创建索引。一般来说，应该在这些列上面创建索引。例如：

1）在经常需要搜索的列上面，可以加快搜索的速度；

2）在作为主键的列上，强制该列的唯一性和组织表中数据的排列结构；

3）在经常用在连接的列上，这些列主要是一些外键，可以加快连接速度；

4）在经常需要根据范围进行搜索的列上创建索引，因为索引已经排序，其指定的范围是连续的；

5）在经常需要排序的列上创建索引，因为索引已经排序，这样查询可以利用索引的排序，加快排序查询时间；

6）在经常使用在Where子句中的列上面创建索引，加快条件的判断速度；

同样，对于有些列不应该创建索引。一般来说，不应该创建索引的列具有以下特点：

1）对于那些在查询中很少使用或者参考列不应该使用索引。这是因为，既然这些列很少使用到，因此有索引和没有索引并不能提高查询速度。相反，由于增加了索引，反而降低了系统的维护速度和增大了空间需求。

2）对于那些只有很少数据值的列也不应该增加索引，这是因为，这些列取值很少，例如人事表的性别列，在查询结果中，结果集的数据行占了表中数据行的很大比例，即需要在表中搜索的数据行的比例很大，增加索引，并不能明显加快检索速度。

3）对于那些定义为text，image和bit数据类型的列不应该增加索引。这是因为，这些列的数据量要么相当大，要么取值很少。

4）当修改性能远远大于检索性能时，不应该创建索引。这是因为，修改性能和检索性能是互相矛盾的。当增加索引时，会提高检索性能，但是会降低修改性能。当减少索引时，会提高修改性能，减低检索性能。因此，当修改性能远远大于检索性能时，不能创建索引。

2.where 和 having的区别？

1）使用场景不同

where可以用于select，update，delete和insert...into语句中。

having只能用于select语句中。

2）子句有区别

where子句中的条件表达式having都可以跟，而having子句中的有些表达式where不可以跟；having子句可以用聚合函数（sum，count，avg，max和min），而where子句不可以。

having是先分组在筛选记录，where在聚合前先筛选记录。也就是说作用在group by子句和having子句前；而having子句在聚合后对组记录进行筛选。

3）作用对象不同

where子句作用于表和视图，having子句作用于组。where在分组和聚集计算之前选取输入行（因此，它控制哪些行进行聚集计算），而having在分组和聚集之后选取分组的行。因此，where子句不能包含聚集函数；因为试图用聚集函数判断那些行输入给聚集运算是没有意义的。相反having子句总是包含聚集函数。（严格来说，你可以写不使用聚集函数having子句，但这样做只是白费劲。同样的条件可以更有效地用于where阶段）

3.连表查询的几种方式，有什么区别

连表查询主要分为三种：内连接，外连接，交叉连接。

1）外连接

概述：

外连接包括三种,分别是左外连接、右外连接、全外连接。

对应的sql关键字:LEFT/RIGHT/FULL OUTER JOIN,通常我们都省略OUTER关键字,写成LEFT/RIGHT/FULL JOIN。

在左、右外连接中都会以一种表为基表，基表的所有行、列都会显示，外表如果和条件不匹配则所有的外表列值都为NULL。

全外连接则所有表的行、列都会显示，条件不匹配的值皆为NULL。

1.左外连接示例:

sql语句: select * from TableA left join TableB on TableA.id=TableB.id

结果:

id	name	id	age
1	t1	1	18
2	t2	2	20
4	t4	NULL	NULL

注释:TableA(基表)中所有的行列都显示了,第三行的条件不匹配所有TableB(外表)的值都为NULL。

2.右外连接示例：

sql语句： select * from TableA right join TableB on TableA.id=TableB.id

结果：

id	name	id	age
1	t1	1	18
2	t2	2	20
NULL	NULL	3	19

注释:TableB(基表)中所有的行列都显示了,第三行的条件不匹配所有TableA(外表)的值都为NULL。

3.全外连接示例:

sql语句：select * from TableA full join TableB on TableA.id=TableB.id

结果:

id	name	id	age
1	t1	1	18
2	t2	2	20
NULL	NULL	3	19
4	t4	NULL	NULL

注释:TableA和TableB的所有行列都显示了，条件不匹配的行的值为NULL

2）内连接

概述：内连接是用比较运算符比较要连接的列的值的连接，不匹配的行不会被显示。sql关键字JOIN 或者INNER JOIN，通常我们写成JOIN

例子:

select * from TableA JOIN TableB on TableA.id=TableB.id

结果:

id	name	id	age
1	t1	1	18
2	t2	2	20

注释:只返回条件匹配的行

以上写法等效于:

select * from TableA,TableB where TableA.id=TableB.id

select * from TableA cross join TableB where TableA.id=TableB.id (cross join 后只能用where不能用on)

3）交叉连接

概念:没有where条件的交叉连接将产生连接表所涉及的笛卡尔积。即TableA的行数*TableB的行数的结果集。（TableA 3行*TableB 3行=9行）

sql语句:

select * from TableA cross join TableB

结果:

id	name	id	age
1	t1	1	18
2	t2	1	18
4	t4	1	18
1	t1	2	20
2	t2	2	20
4	t4	2	20
1	t1	3	19
2	t2	3	19
4	t4	3	19

注释:返回3*3=9行数据，即笛卡尔积。

以上写法等效于:

select * from TableA,TableB

4.聚合函数有哪些？

count，sum， avg，max，min

使用规范时默认的是all

distinct 指定所有的唯一非空值行

count (行的数目)

select count ( 列或者*) from 表

sum (总和)

select sum（计数规范）from

分组（group by）

select 列a ，聚合函数 from 表 where 过滤条件 group by 列a （以列a来分组）

过滤聚合函数（having）

select 列a ，聚合函数 from 表 where 过滤条件 group by 列a having 聚合函数过滤条件

要注意的是 SQL语句的执行顺序

(5)select 列a ，聚合函数（1） from 表（2） where 过滤条件（3） group by 列a （4） having 聚合函数过滤条件（6） order by

5.在使用mysql中，怎么去找出要优化的sql

使用慢查询日志工具

6.事务隔离级别，以及事务的传播有哪几种

数据库事务的隔离级别有4个，由低到高依次为Read uncommitted、Read committed、Repeatable read、Serializable，这四个级别可以逐个解决脏读、不可重复读、幻读这几类问题。

1） ISOLATION_READ_UNCOMMITTED：这是事务最低的隔离级别，它允许另外一个事务可以看到这个事务未提交的数据

这种隔离级别会产生脏读，不可重复读和幻像读。

2）ISOLATION_READ_COMMITTED：保证一个事务修改的数据提交后才能被另外一个事务读取。另外一个事务不能读取该事务未提交的数据

3）ISOLATION_REPEATABLE_READ：这种事务隔离级别可以防止脏读，不可重复读。但是可能出现幻像读。

它除了保证一个事务不能读取另一个事务未提交的数据外，还保证了避免下面的情况产生(不可重复读)。

4）ISOLATION_SERIALIZABLE：这是花费最高代价但是最可靠的事务隔离级别。事务被处理为顺序执行。

除了防止脏读，不可重复读外，还避免了幻像读。

第1级别：Read Uncommitted(读取未提交内容)

(1)所有事务都可以看到其他未提交事务的执行结果
(2)本隔离级别很少用于实际应用，因为它的性能也不比其他级别好多少
(3)该级别引发的问题是——脏读(Dirty Read)：读取到了未提交的数据

#首先，修改隔离级别
set tx_isolation='READ-UNCOMMITTED';
select @@tx_isolation;
+------------------+
| @@tx_isolation |
+------------------+
| READ-UNCOMMITTED |
+------------------+

#事务A：启动一个事务
start transaction;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 3 | 3 |
+------+------+

#事务B：也启动一个事务(那么两个事务交叉了)
在事务B中执行更新语句，且不提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 |
| 2 | 2 |
| 3 | 3 |
+------+------+

#事务A：那么这时候事务A能看到这个更新了的数据吗?
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 | --->可以看到！说明我们读到了事务B还没有提交的数据
| 2 | 2 |
| 3 | 3 |
+------+------+

#事务B：事务B回滚,仍然未提交
rollback;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 3 | 3 |
+------+------+

#事务A：在事务A里面看到的也是B没有提交的数据
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 | --->脏读意味着我在这个事务中(A中)，事务B虽然没有提交，但它任何一条数据变化，我都可以看到！
| 2 | 2 |
| 3 | 3 |
+------+------+

第2级别：Read Committed(读取提交内容)

(1)这是大多数数据库系统的默认隔离级别（但不是MySQL默认的）
(2)它满足了隔离的简单定义：一个事务只能看见已经提交事务所做的改变
(3)这种隔离级别出现的问题是——不可重复读(Nonrepeatable Read)：不可重复读意味着我们在同一个事务中执行完全相同的select语句时可能看到不一样的结果。
|——>导致这种情况的原因可能有：(1)有一个交叉的事务有新的commit，导致了数据的改变;(2)一个数据库被多个实例操作时,同一事务的其他实例在该实例处理其间可能会有新的commit

#首先修改隔离级别
set tx_isolation='read-committed';
select @@tx_isolation;
+----------------+
| @@tx_isolation |
+----------------+
| READ-COMMITTED |
+----------------+

#事务A：启动一个事务
start transaction;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 3 | 3 |
+------+------+

#事务B：也启动一个事务(那么两个事务交叉了)
在这事务中更新数据，且未提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 |
| 2 | 2 |
| 3 | 3 |
+------+------+

#事务A：这个时候我们在事务A中能看到数据的变化吗?
select * from tx; --------------->
+------+------+ |
| id | num | |
+------+------+ |
| 1 | 1 |--->并不能看到！ |
| 2 | 2 | |
| 3 | 3 | |
+------+------+ |——>相同的select语句，结果却不一样
|
#事务B：如果提交了事务B呢? |
commit; |
|
#事务A: |
select * from tx; --------------->
+------+------+
| id | num |
+------+------+
| 1 | 10 |--->因为事务B已经提交了，所以在A中我们看到了数据变化
| 2 | 2 |
| 3 | 3 |
+------+------+

第3级别：Repeatable Read(可重读)

(1)这是MySQL的默认事务隔离级别
(2)它确保同一事务的多个实例在并发读取数据时，会看到同样的数据行
(3)此级别可能出现的问题——幻读(Phantom Read)：当用户读取某一范围的数据行时，另一个事务又在该范围内插入了新行，当用户再读取该范围的数据行时，会发现有新的“幻影” 行
(4)InnoDB和Falcon存储引擎通过多版本并发控制(MVCC，Multiversion Concurrency Control)机制解决了该问题

#首先，更改隔离级别
set tx_isolation='repeatable-read';
select @@tx_isolation;
+-----------------+
| @@tx_isolation |
+-----------------+
| REPEATABLE-READ |
+-----------------+

#事务A：启动一个事务
start transaction;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 |
| 2 | 2 |
| 3 | 3 |
+------+------+

#事务B：开启一个新事务(那么这两个事务交叉了)
在事务B中更新数据，并提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 |
| 2 | 2 |
| 3 | 3 |
+------+------+
commit;

#事务A：这时候即使事务B已经提交了,但A能不能看到数据变化？
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 1 | --->还是看不到的！(这个级别2不一样，也说明级别3解决了不可重复读问题)
| 2 | 2 |
| 3 | 3 |
+------+------+

#事务A：只有当事务A也提交了，它才能够看到数据变化
commit;
select * from tx;
+------+------+
| id | num |
+------+------+
| 1 | 10 |
| 2 | 2 |
| 3 | 3 |
+------+------+

第4级别：Serializable(可串行化)
(1)这是最高的隔离级别
(2)它通过强制事务排序，使之不可能相互冲突，从而解决幻读问题。简言之,它是在每个读的数据行上加上共享锁。
(3)在这个级别，可能导致大量的超时现象和锁竞争

#首先修改隔离界别
set tx_isolation='serializable';
select @@tx_isolation;
+----------------+
| @@tx_isolation |
+----------------+
| SERIALIZABLE |
+----------------+

#事务A：开启一个新事务
start transaction;

#事务B：在A没有commit之前，这个交叉事务是不能更改数据的
start transaction;
insert tx values('4','4');
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
update tx set num=10 where id=1;
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction

7种传播行为

1）PROPAGATION_REQUIRED：如果当前没有事务，就创建一个新事务，如果当前存在事务，就加入该事务，该设置是最常用的设置。

2）PROPAGATION_SUPPORTS：支持当前事务，如果当前存在事务，就加入该事务，如果当前不存在事务，就以非事务执行。

3）PROPAGATION_MANDATORY：支持当前事务，如果当前存在事务，就加入该事务，如果当前不存在事务，就抛出异常。

4）PROPAGATION_REQUIRES_NEW：创建新事务，无论当前存不存在事务，都创建新事务。

5）PROPAGATION_NOT_SUPPORTED：以非事务方式执行操作，如果当前存在事务，就把当前事务挂起。

6）PROPAGATION_NEVER：以非事务方式执行，如果当前存在事务，则抛出异常。

7) PROPAGATION_NESTED：如果当前存在事务，则在嵌套事务内执行。如果当前没有事务，则执行与PROPAGATION_REQUIRED类似的操作。

java 面试总结（数据库）

猜你喜欢