java 面试总结(数据库)

1.建立索引的规则

   索引是建立在数据库表中的某些列的上面。因此,在创建索引的时候,应该仔细考虑在哪些列上面可以创建索引,在哪些列上面不能创建索引。一般来说,应该在这些列上面创建索引。例如:

   1)在经常需要搜索的列上面,可以加快搜索的速度;

   2)在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;

   3)在经常用在连接的列上,这些列主要是一些外键,可以加快连接速度;

   4)在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;

   5)在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;

   6)在经常使用在Where子句中的列上面创建索引,加快条件的判断速度;

   同样,对于有些列不应该创建索引。一般来说,不应该创建索引的列具有以下特点:

   1)对于那些在查询中很少使用或者参考列不应该使用索引。这是因为,既然这些列很少使用到,因此有索引和没有索引并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。

   2)对于那些只有很少数据值的列也不应该增加索引,这是因为,这些列取值很少,例如人事表的性别列,在查询结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大,增加索引,并不能明显加快检索速度。

   3)对于那些定义为text,image和bit数据类型的列不应该增加索引。这是因为,这些列的数据量要么相当大,要么取值很少。

   4)当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,减低检索性能。因此,当修改性能远远大于检索性能时,不能创建索引。

    2.where 和 having的区别?

      1)使用场景不同

         where可以用于select,update,delete和insert...into语句中。

         having只能用于select语句中。

      2)子句有区别

         where子句中的条件表达式having都可以跟,而having子句中的有些表达式where不可以跟;having子句可以用聚合函数(sum,count,avg,max和min),而where子句不可以。

          having是先分组在筛选记录,where在聚合前先筛选记录。也就是说作用在group by子句和having子句前;而having子句在聚合后对组记录进行筛选。

      3)作用对象不同

           where子句作用于表和视图,having子句作用于组。where在分组和聚集计算之前选取输入行(因此,它控制哪些行进行聚集计算),而having在分组和聚集之后选取分组的行。因此,where子句不能包含聚集函数;因为试图用聚集函数判断那些行输入给聚集运算是没有意义的。相反having子句总是包含聚集函数。(严格来说,你可以写不使用聚集函数having子句,但这样做只是白费劲。同样的条件可以更有效地用于where阶段)

      3.连表查询的几种方式,有什么区别

       连表查询主要分为三种: 内连接,外连接,交叉连接。

      1)外连接

       概述:

       外连接包括三种,分别是左外连接、右外连接、全外连接。

       对应的sql关键字:LEFT/RIGHT/FULL OUTER JOIN,通常我们都省略OUTER关键字,写成LEFT/RIGHT/FULL JOIN。

       在左、右外连接中都会以一种表为基表,基表的所有行、列都会显示,外表如果和条件不匹配则所有的外表列值都为NULL。

        全外连接则所有表的行、列都会显示,条件不匹配的值皆为NULL。   

       1.左外连接示例:

        sql语句:  select * from TableA left join TableB on TableA.id=TableB.id

        结果:

id

name

id

age

1

t1

1

18

2

t2

2

20

4

t4

NULL

NULL

        注释:TableA(基表)中所有的行列都显示了,第三行的条件不匹配所有TableB(外表)的值都为NULL。

    2.右外连接示例:

    sql语句: select * from TableA right join TableB on TableA.id=TableB.id

    结果:

id

name

id

age

1

t1

1

18

2

t2

2

20

NULL

NULL

3

19

 注释:TableB(基表)中所有的行列都显示了,第三行的条件不匹配所有TableA(外表)的值都为NULL。

  3.全外连接示例:

    sql语句:select * from TableA full join TableB on TableA.id=TableB.id

    结果:

id

name

id

age

1

t1

1

18

2

t2

2

20

NULL NULL 3

19

4 t4

NULL

NULL

注释:TableA和TableB的所有行列都显示了,条件不匹配的行的值为NULL

  2)内连接

概述:内连接是用比较运算符比较要连接的列的值的连接,不匹配的行不会被显示。sql关键字JOIN 或者INNER JOIN,通常我们写成JOIN

例子:

    select * from TableA JOIN TableB on TableA.id=TableB.id

结果:

id

name

id

age

1

t1

1

18

2

t2

2

20

注释:只返回条件匹配的行

以上写法等效于:

    select * from TableA,TableB where TableA.id=TableB.id

    select * from TableA cross join TableB where TableA.id=TableB.id (cross join 后只能用where不能用on)

3)交叉连接

概念:没有where条件的交叉连接将产生连接表所涉及的笛卡尔积。即TableA的行数*TableB的行数的结果集。(TableA 3行*TableB 3行=9行)

sql语句:

    select * from TableA cross join TableB

结果:

id

name

id

age

1

t1

1

18

2

t2

1

18

4

t4

1

18

1

t1

2

20

2

t2

2

20

4

t4

2

20

1

t1

3

19

2

t2

3

19

4

t4

3

19

注释:返回3*3=9行数据,即笛卡尔积。

以上写法等效于:

select * from TableA,TableB

     4.聚合函数有哪些?

      count,sum, avg,max,min

     使用规范时 默认的是all

     distinct   指定所有的唯一非空值行

     count  (行的数目)

     select count (  列或者*)  from  表

     sum  (总和)

     select  sum(计数规范)from

     分组  (group by)

     select  列a  , 聚合函数 from 表      where 过滤条件      group  by  列a (以列a来分组)

     过滤聚合函数(having)

      select  列a  , 聚合函数 from 表      where 过滤条件      group  by  列a    having  聚合函数过滤条件

     要注意的是  SQL语句的执行顺序

     (5)select  列a  , 聚合函数  (1) from 表    (2)  where 过滤条件    (3)  group by  列a  (4)  having   聚合函数过滤条件  (6) order   by

     5.在使用mysql中,怎么去找出要优化的sql

         使用慢查询日志工具

     6.事务隔离级别,以及事务的传播有哪几种

        数据库事务的隔离级别有4个,由低到高依次为Read uncommitted、Read committed、Repeatable read、Serializable,这四个级别可以逐个解决脏读、不可重复读、幻读这几类问题。

       

     1) ISOLATION_READ_UNCOMMITTED:这是事务最低的隔离级别,它允许另外一个事务可以看到这个事务未提交的数据

           这种隔离级别会产生脏读,不可重复读和幻像读。

      2)ISOLATION_READ_COMMITTED:保证一个事务修改的数据提交后才能被另外一个事务读取。另外一个事务不能读取该事务未提交的数据

      3)ISOLATION_REPEATABLE_READ:这种事务隔离级别可以防止脏读,不可重复读。但是可能出现幻像读。

            它除了保证一个事务不能读取另一个事务未提交的数据外,还保证了避免下面的情况产生(不可重复读)。

       4)ISOLATION_SERIALIZABLE:这是花费最高代价但是最可靠的事务隔离级别。事务被处理为顺序执行。

            除了防止脏读,不可重复读外,还避免了幻像读。

      第1级别:Read Uncommitted(读取未提交内容)

      (1)所有事务都可以看到其他未提交事务的执行结果
      (2)本隔离级别很少用于实际应用,因为它的性能也不比其他级别好多少
      (3)该级别引发的问题是——脏读(Dirty Read):读取到了未提交的数据

#首先,修改隔离级别
set tx_isolation='READ-UNCOMMITTED';
select @@tx_isolation;
+------------------+
| @@tx_isolation   |
+------------------+
| READ-UNCOMMITTED |
+------------------+

#事务A:启动一个事务
start transaction;
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |    1 |
|    2 |    2 |
|    3 |    3 |
+------+------+

#事务B:也启动一个事务(那么两个事务交叉了)
       在事务B中执行更新语句,且不提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |   10 |
|    2 |    2 |
|    3 |    3 |
+------+------+

#事务A:那么这时候事务A能看到这个更新了的数据吗?
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |   10 |   --->可以看到!说明我们读到了事务B还没有提交的数据
|    2 |    2 |
|    3 |    3 |
+------+------+

#事务B:事务B回滚,仍然未提交
rollback;
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |    1 |
|    2 |    2 |
|    3 |    3 |
+------+------+

#事务A:在事务A里面看到的也是B没有提交的数据
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |    1 |      --->脏读意味着我在这个事务中(A中),事务B虽然没有提交,但它任何一条数据变化,我都可以看到!
|    2 |    2 |
|    3 |    3 |
+------+------+

第2级别:Read Committed(读取提交内容)

(1)这是大多数数据库系统的默认隔离级别(但不是MySQL默认的)
(2)它满足了隔离的简单定义:一个事务只能看见已经提交事务所做的改变
(3)这种隔离级别出现的问题是——不可重复读(Nonrepeatable Read):不可重复读意味着我们在同一个事务中执行完全相同的select语句时可能看到不一样的结果。
     |——>导致这种情况的原因可能有:(1)有一个交叉的事务有新的commit,导致了数据的改变;(2)一个数据库被多个实例操作时,同一事务的其他实例在该实例处理其间可能会有新的commit

#首先修改隔离级别
set tx_isolation='read-committed';
select @@tx_isolation;
+----------------+
| @@tx_isolation |
+----------------+
| READ-COMMITTED |
+----------------+

#事务A:启动一个事务
start transaction;
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |    1 |
|    2 |    2 |
|    3 |    3 |
+------+------+

#事务B:也启动一个事务(那么两个事务交叉了)
       在这事务中更新数据,且未提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |   10 |
|    2 |    2 |
|    3 |    3 |
+------+------+

#事务A:这个时候我们在事务A中能看到数据的变化吗?
select * from tx; --------------->
+------+------+                |
| id   | num  |                |
+------+------+                |
|    1 |    1 |--->并不能看到!  |
|    2 |    2 |                |
|    3 |    3 |                |
+------+------+                |——>相同的select语句,结果却不一样
                                  |
#事务B:如果提交了事务B呢?            |
commit;                           |
                                  |
#事务A:                            |
select * from tx; --------------->
+------+------+
| id   | num  |
+------+------+
|    1 |   10 |--->因为事务B已经提交了,所以在A中我们看到了数据变化
|    2 |    2 |
|    3 |    3 |
+------+------+

第3级别:Repeatable Read(可重读)

(1)这是MySQL的默认事务隔离级别
(2)它确保同一事务的多个实例在并发读取数据时,会看到同样的数据行
(3)此级别可能出现的问题——幻读(Phantom Read):当用户读取某一范围的数据行时,另一个事务又在该范围内插入了新行,当用户再读取该范围的数据行时,会发现有新的“幻影” 行
(4)InnoDB和Falcon存储引擎通过多版本并发控制(MVCC,Multiversion Concurrency Control)机制解决了该问题

#首先,更改隔离级别
set tx_isolation='repeatable-read';
select @@tx_isolation;
+-----------------+
| @@tx_isolation  |
+-----------------+
| REPEATABLE-READ |
+-----------------+

#事务A:启动一个事务
start transaction;
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |    1 |
|    2 |    2 |
|    3 |    3 |
+------+------+

#事务B:开启一个新事务(那么这两个事务交叉了)
       在事务B中更新数据,并提交
start transaction;
update tx set num=10 where id=1;
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |   10 |
|    2 |    2 |
|    3 |    3 |
+------+------+
commit;

#事务A:这时候即使事务B已经提交了,但A能不能看到数据变化?
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |    1 | --->还是看不到的!(这个级别2不一样,也说明级别3解决了不可重复读问题)
|    2 |    2 |
|    3 |    3 |
+------+------+

#事务A:只有当事务A也提交了,它才能够看到数据变化
commit;
select * from tx;
+------+------+
| id   | num  |
+------+------+
|    1 |   10 |
|    2 |    2 |
|    3 |    3 |
+------+------+

第4级别:Serializable(可串行化)
(1)这是最高的隔离级别
(2)它通过强制事务排序,使之不可能相互冲突,从而解决幻读问题。简言之,它是在每个读的数据行上加上共享锁。
(3)在这个级别,可能导致大量的超时现象和锁竞争

#首先修改隔离界别
set tx_isolation='serializable';
select @@tx_isolation;
+----------------+
| @@tx_isolation |
+----------------+
| SERIALIZABLE   |
+----------------+

#事务A:开启一个新事务
start transaction;

#事务B:在A没有commit之前,这个交叉事务是不能更改数据的
start transaction;
insert tx values('4','4');
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
update tx set num=10 where id=1;
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction

7种传播行为

  1)PROPAGATION_REQUIRED:如果当前没有事务,就创建一个新事务,如果当前存在事务,就加入该事务,该设置是最常用的设置。

  2)PROPAGATION_SUPPORTS:支持当前事务,如果当前存在事务,就加入该事务,如果当前不存在事务,就以非事务执行。

  3)PROPAGATION_MANDATORY:支持当前事务,如果当前存在事务,就加入该事务,如果当前不存在事务,就抛出异常。

  4)PROPAGATION_REQUIRES_NEW:创建新事务,无论当前存不存在事务,都创建新事务。

  5)PROPAGATION_NOT_SUPPORTED:以非事务方式执行操作,如果当前存在事务,就把当前事务挂起。

  6)PROPAGATION_NEVER:以非事务方式执行,如果当前存在事务,则抛出异常。

 7) PROPAGATION_NESTED:如果当前存在事务,则在嵌套事务内执行。如果当前没有事务,则执行与PROPAGATION_REQUIRED类似的操作。

猜你喜欢

转载自blog.csdn.net/suchahaerkang/article/details/82986327
今日推荐