Mysql隔离级别之MVCC的ReadView的理解

Mysql的隔离级别分为: 读未提交、读已提交、可重复读、串行读

比较常用的两种分别是读已提交、可重复读,那么Mysql是如何保证多个事务读取一条数据的隔离性的?

undo Log

当我们读取一条被其他事务变更的数据时,会在undo Log中产生一条变更前的日志.这个日志可以专门用于回滚。

我们大概来看一下这个日志的大概结构:
在这里插入图片描述
前面三个字段属于变更前的,另外:
trx_id : 代表是哪个事务编号修改的。

需要注意的是该编号是严格按照递增顺序产生的。比如1、2、3、4、5

roll_pointer : 相当于一个链表,往下查找就是上一次更改前的。当一条数据被更改了多次之后,由该字段构建成一个链表俗称版本链

有了undo Log的话可以很快追溯到更改之前的数据,有了这个之后,假设多个事务都在读同一条记录,并且还发生了修改,这个时候

  • 哪些能读?
  • 哪些版本才是符合当前事务该看到的数据呢?

MVCC

多版本并发控制,指的就是在使用读提交和可重复读隔离级别的事务,在执行普通select操作时,访问记录版本链的过程;使不同事务的读写、写读操作并发执行,提高系统性能;

Read View 读视图

基于当前活跃事务列表构成的ReadView,当某个事务创建ReadView时,会将当前活跃的事务也加入其中。

我们来看一下大概结构:
在这里插入图片描述
readview中四个比较重要的概念:
m_ids:表示在生成readview时,当前系统中活跃的读写事务id列表

比如创建事务10创建RV时,系统正在活跃的事务有5,6,7那么5,6,7都会加入到10的m_ids中.

min_trx_id:表示在生成readview时,当前系统中活跃的读写事务中最小的事务id,也就是m_ids中最小的值;
max_trx_id:表示生成readview时,系统中应该分配给下一个事务的id值;
creator_trx_id:表示生成该readview的事务的事务id;

有了readview,在访问某条记录时,按照以下步骤判断记录的某个版本是否可见:

基于可重复读

下面是对于同一条数据的多个事务读取流程:
基于可重复读的版本查询流程图
ReadView(简称RV)一旦创建是不可变的,即便其中某个线程事务提交了,也不会影响当前线程创建的ReadView,你可以理解为一个副本快照。

总的来说判断就三个条件:

  1. undo log的数据中包含的trx_id是否符合min_trx_idmax_trx_id之间
    1.1 如果小于min_trx_id说明创建RV 之前 的时候这个trx_id就已经事务提交了,不活跃了,说明可以读。
    1.2 如果大于max_trx_id说明这个版本是在创建RV 之后 产生的,不可读。因为创建RV时你这个版本还不存在。
    1.3 如果是在这之间的再看步骤2
  2. 查看trx_id是否包含m_id之中:
    2.1 包含说明创建RV的时候,还是活跃(没提交)事务。那么是不可见的,脏读;继续看步骤3
    2.2 不包含说明创建RV之前这个事务已经被提交了,那么是可见的。
  3. 到了这里说明这条数据的变更版本在RV之内,则要查看creator_trx_id与trx_id是否一致:
    3.1 一致说明就是当前事务创建的;允许使用
    3.2 否则说明是当前RV的其他事务操作的不能使用;

基于上述规则,很好的解决了一致性读的问题;当前线程创建完RV之后,读到的数据都是相同的;不会读到其他事务未提交和后提交的数据。

可重复读的RV是以一个事务的开始和结束作为它的生命周期的

基于读提交级别的流程

读提交级别是能够读到其他事务提交的数据的,那么这个时候上面的流程是不是满足不了呀?因为假设ABC都在一个RV之中,C提交了数据,但是B看不到呀,因为条件2就满足不了呀;

这个时候Mysql就把这个级别的RV做了调整,每次读取数据的时候会创建一个新的ReadView

ReadView变化

当RV中的事务B提交了事务的时候,A每次会创建一个新的RV来查看数据版本,新的RV的m_ids肯定是不包含已经提交的事务B的,这个时候就能够读到事务B的数据了。

之前一直以为可重复读没有解决幻读的问题,现在基于这个流程另外加上命令行调试之后发现应该是解决了的。

因为一旦创建RV的话,当前活跃事务快照已经生成,这个时候如果新来的事务或者快照内的事务新增了数据也不会读到:

  • 快照事务内产生的变更在前面说的2.1会被跳过
  • 快照之后会在1.2被过跳过

如有问题,欢迎留言交流。