日志系统:一条SQL更新语句是如何执行的?&&阅读笔记

阅读完文章后,自己的一些小记录。原文

前言

一条更新语句的执行流程与查询流程类似 一条SQL查询语句是如何执行的
在这里插入图片描述
与查询流程不一样的是,更新流程还涉及两个重要的日志模块:redo log(重做日志)和binlog(归档日志)

redo log

记账例子:
酒店掌柜有一个粉板,专门用来记录客人的赊账记录。如果赊账的人不多,那么他可以把顾客名和账目写在板上。但如果赊账的人多了,粉板总会有记不下的时候,这个时候掌柜一定还有一个专门记录赊账的账本。

如果有人要赊账或者还账的话,掌柜一般有两种做法:

  • 一种做法是直接把账本翻出来,把这次赊的账加上去或者扣除掉;
  • 另一种做法是先在粉板上记下这次的账,等打烊以后再把账本翻出来核算。

当声音红火时,选择先把帐记在白板上,等闲的时候再写到账本。

粉板和账本配合的整个过程,就是MySQL里的WAL技术,Write-Ahead Logging,它的关键点就是先写日志,再写磁盘,也就是先写粉板,等不忙的时候再写账本。

当有新记录需要更新时,InnoDB引擎会将记录写到redo log(粉板)里,并更新内存,这时更新就算完成了。然后InnoDB引擎会在系统比较空闲的时候,将操作记录更新到磁盘。

如果某天赊账的特别多,粉板写满了,这个时候就由不得你空闲了,只好放下手中活,把粉板中的一部分赊账记录更新到账本中,然后把这些记录从粉板上擦掉,为记新账腾出空间。这个原因,也是我们sql语句偶尔出现很慢的原因,可能是在清理redo log日志

InnoDB的redo log是固定大小的,比如可以配置为一组4个文件,每个文件的大小是1GB,那么这块“粉板”总共就可以记录4GB的操作。从头开始写,写到末尾就又回到开头循环写。

在这里插入图片描述
redo log可以保证即使数据库发生异常重启,之前提交的记录都不会丢失,这个能力称为crash-safe

重要的日志模块:binlog

redo log是InnoDB引擎特有的日志,而Server层也有自己的日志,称为binlog(归档日志)

重点来了,为什么要有两份日志?
MySQL自带的引擎是MyISAM,MyISAM并没有crash-safe的能力
两种日志的差异:

  • redo log是InnoDB引擎特有的;binlog是MySQL的Server层实现的,所有引擎都可以使用。
  • redo log是物理日志,记录的是“在某个数据页上做了什么修改”;binlog是逻辑日志,记录的是这个语句的原始逻辑,比如“给ID=2这一行的c字段加1 ”。
  • redo log是循环写的,空间固定会用完;binlog是可以追加写入的。“追加写”是指binlog文件写到一定大小后会切换到下一个,并不会覆盖以前的日志。

update T set c=c+1 where ID=2; 这条语句是怎么执行的呢?

  • 执行器先找引擎取ID=2这一行。ID是主键,引擎直接用树搜索找到这一行。如果ID=2这一行所在的数据页本来就在内存中,就直接返回给执行器;否则,需要先从磁盘读入内存,然后再返回。
  • 执行器拿到引擎给的行数据,把这个值加上1,比如原来是N,现在就是N+1,得到新的一行数据,再调用引擎接口写入这行新数据。
  • 引擎将这行新数据更新到内存中,同时将这个更新操作记录到redo log里面,此时redo log处于prepare状态。然后告知执行器执行完成了,随时可以提交事务。
  • 执行器生成这个操作的binlog,并把binlog写入磁盘
  • 执行器调用引擎的提交事务接口,引擎把刚刚写入的redo log改成提交(commit)状态,更新完成

浅色框在InnoDB内部执行的,深色框在执行器中执行的
在这里插入图片描述
redo log的写入拆成了两个步骤:prepare和commit,这就是"两阶段提交"。

两阶段提交

两阶段提交的作用是让两份日志的逻辑一致!
为什么日志需要“两阶段提交”。这里不妨用反证法来进行解释。

  • 先写redo log后写binlog。假设在redo log写完,binlog还没有写完的时候,MySQL进程异常重启。redo log写完之后,系统即使崩溃,仍然能够把数据恢复回来。但是由于binlog里面没有记录这个语句。因此,之后备份日志的时候,存起来的binlog里面就没有这条语句。需要用这个binlog来恢复临时库的话,由于这个语句的binlog丢失,这个临时库就会少了这一次更新,与原库的值不同。
    -先写binlog后写redo log。如果在binlog写完之后crash,由于redo log还没写,崩溃恢复以后这个事务无效。但是binlog里面已经记录了。所以,在之后用binlog来恢复的时候就多了一个事务出来,恢复出来的值,与原库的值不同。

可以看到,如果不使用“两阶段提交”,那么数据库的状态就有可能和用它的日志恢复出来的库的状态不一致。

猜你喜欢

转载自blog.csdn.net/weixin_44233929/article/details/106668510