MySQL InnoDB MVCC(IT技术)

MVCC（Multiversion concurrency control）：多版本并发控制，并发访问（读或写）数据库时，对正在事务内处理的数据做多版本的管理。以达到用来避免写操作的堵塞，从而引发读操作的并发问题。

MVCC 逻辑流程

插入

MySQL 在每一行数据中都会默认添加一些隐藏列 DB_TRX_ID、DB_ROLL_PT。

思考：如果事务是自动提交的（SET AUTOCOMMIT = NO），且未手动开启事务，执行如下两条 SQL，插入的数据会是什么样子的？

因为事务是自动提交的，所以两条插入语句会分别获取事务ID，所以这里插入的数据行的版本号是1和2。

删除

修改

查询

案例分析

案例一

虽然在执行 3,4 步骤的时候更新 id=1 的数据，但是根据 MVCC 的查询逻辑流程，再次执行2，获取到的数据依然和第一次一样。

案例二

根据 MVCC 的查询逻辑流程，执行1,2，获取到的数据是事务B未提交的数据，这个是有问题的。

分析了案例一和案例二，发现 MVCC 不能解决案例二的问题，InnoDB 会使用 Undo log 解决案例二的问题。

Undo Log

Undo Log 的定义

Undo：意为取消，以撤销操作为目的，返回指定某个状态的操作。

Undo Log：数据库事务提交之前，会将事务修改数据的镜像（即修改前的旧版本）存放到 undo 日志里，当事务回滚时，或者数据库奔溃时，可以利用 undo 日志，即旧版本数据，撤销未提交事务对数据库产生的影响。。

当前读和快照读

快照读

SQL 读取的数据是快照版本，也就是历史版本，普通的 SELECT 就是快照读。

InnoDB 快照读，数据的读取将由 cache（原本数据）+ Undo Log（事务修改过的数据）两部分组成。

当前读

SQL 读取的数据是最新版本，通过锁机制来保证读取的数据无法通过其他事务进行修改。

UPDATE 、DELETE 、INSERT 、SELECT … LOCK IN SHARE MODE 、SELECT … FOR UPDATE 都是当前读，这些操作在《MySQL InnoDB 锁》这篇文章中有过演示，事务A执行这些 SQL，会阻塞事务B的 SQL 执行。

在 InnoDB 引擎里面，快照读通过 MVCC 解决幻读的问题，当前读通过 Next-Key Locks 解决幻读的问题。

Redo Log

Redo Log 的定义

Redo Log：指事务中操作的任何数据，将最新的数据备份到一个地方（Redo Log）。

Redo Log 的持久化：不是随着事务的提交才写入的，而是在事务的执行过程中，便开始写入 Redo Log 中，具体的落盘策略可以进行配置。

Redo Log 实现事务持久性：防止在发生故障的时间点，尚有脏页未写入表的 IBD 文件中，在重启 MySQL 服务的时候，根据 Redo Log 进行重做，从而达到事务的未入磁盘数据进行持久化这一特性。

InnoDB 不是每一次提交事务都把数据从缓存区持久化到硬盘的，因为每次提交事务都把数据持久化到硬盘，效率很低，每一次持久化都需要执行 IO 操作。

InnoDB 会把每次数据变化会先进入 Redo Buffer 中，事务提交了，会根据策略把新的数据写入 Redo Log 中，InnoDB 就会认为这次事务提交成功了，数据并不一定马上就进入表的 IBD 文件中。

疑问：持久化到 Redo Log 中和持久化到表的 IBD 文件一样都是 IO 操作，为什么要设计 Redo Log 呢？

其实是因为持久化到 Redo Log 中是顺序 IO 的操作，而持久化到表的 IBD 文件中是一个随机 IO 的操作，比如我们需要更新 id=1 和 id=8 的数据，如果是 Redo Log，就只需要把更新的数据顺序存入 Redo Log 中；但如果是表的 IBD 文件，就需要先找到 id=1 和 id=8 的两个不连续的磁盘文件地址，再做持久化操作，影响数据库服务的并发性能。

Redo Log 的持久化配置

指定 Redo Log 记录在 {datadir}/ib_logfile1 和 ib_logfile2 两个文件中，可以通过 innodb_log_group_home_dir配置指定目录存储。

一旦事务成功提交且数据持久化到表的 IBD 文件中之后，此时 Redo Log 中的对应事务数据记录就失去了意义，所以 Redo Log 的写入是日志文件循环写入的过程，也就是覆盖写的过程。

指定 Redo Log 日志文件组中的数量 innodb_log_files_in_group 默认为2
指定 Redo Log 每一个日志文件最大存储量 innodb_log_file_size 默认48M
指定 Redo Log 在 cache/buffer 中的 buffer 池大小 innodb_log_buffer_size 默认16M

Redo Buffer 持久化到 Redo Log 的策略，通过设置 Innodb_flush_log_at_trx_commit 的值：

取值0：每秒提交 Redo buffer -> Redo Log OS cache -> flush cache to disk，可能丢失一秒内的事务数据。
取值1（默认值）：每次事务提交执行 Redo Buffer -> Redo Log OS cache -> flush cache to disk，最安全，性能最差的方式
取值2：每次事务提交执行 Redo Buffer -> Redo log OS cache 再每一秒执行 -> flush cache to disk 操作

一般建议选择取值2，因为 MySQL 挂了最多损失一次事务提交的数据，整个服务期挂了才会损失一秒的事务提交数据。

MySQL InnoDB MVCC

MVCC

MVCC 的定义