mysql事务隔离分析

首先说明下,这里主要内容为整理总结网络搜索的零散信息。

写在最前面,mysql事务是在Innodb引擎中得以实现的,如果这点不了解的话,请自行了解。

事务直接数据的可见性通过MVCC(多版本并发控制)实现。对同一记录的修改会保存历史版本的数据,通过一系列的逻辑看判断当前事务应该获取的是那个版本的数据,也就是通常意义上的可见性。

Innodb会为每行记录添加三个隐形字段:6字节的事务IDDB_TRX_ID)、7字节的回滚指针(DB_ROLL_PTR)、隐藏的ID。

MVCC 在mysql 中的实现依赖的是 undo log 与 read view。

a.undo log: undo log中记录的是数据表记录行的多个版本,也就是事务执行过程中的回滚段,其实就是MVCC 中的一行原始数据的多个版本镜像数据。

b.read view: 主要用来判断当前版本数据的可见性。

下面看下一条记录的更新过程:

1.初始数据行

F1~F6是某行列的名字,1~6是其对应的数据。后面三个隐含字段分别对应该行的事务号和回滚指针,假如这条数据是刚INSERT的,可以认为ID为1,其他两个字段为空。
2.事务1更改该行的各字段的值

当事务1更改该行的值时,会进行如下操作:
用排他锁锁定该行
记录redo log
把该行修改前的值Copy到undo log,即上图中下面的行
修改当前行的值,填写事务编号,使回滚指针指向undo log中的修改前的行
3.事务2修改该行的值

下面讲下调用select时mysql到底做了什么:

首先,看下read_view结构:

struct read_view_t{
    // 由于是逆序排列,所以low/up有所颠倒
    // 能看到当前行版本的高水位标识,>= low_limit_id皆不能看见,low_limit_id取值为max_trx_id(即尚未被分配的trx_id)
    trx_id_t    low_limit_id;
    // 能看到当前行版本的低水位标识,< up_limit_id皆能看见,up_limit_id取值为当前活跃最小事务id
    trx_id_t    up_limit_id;
    // 当前活跃事务(即未提交的事务)的数量
    ulint        n_trx_ids;
    // 以逆序排列的当前获取活跃事务id的数组
    // 其up_limit_id<tx_id<low_limit_id
    trx_id_t*    trx_ids;    
    // 创建当前视图的事务id
    trx_id_t    creator_trx_id;
    // 事务系统中的一致性视图链表
    UT_LIST_NODE_T(read_view_t) view_list;
};

read_view构建逻辑:

在mysql的trx_sys中,一直维护着一个全局的活跃的读写事务id(trx_sys->descriptors),id按照从小到大排序,表示在某个时间点,数据库中所有的活跃(已经开始但还没提交)的读写(必须是读写事务,只读事务不包含在内)事务。当需要一个一致性读的时候(即创建新的readview时),会把全局读写事务id拷贝一份到readview本地(read_view_t->trx_ids),当做当前事务的快照。read_view_t->up_limit_id是read_view_t->trx_ids这数组中最小的值,read_view_t->low_limit_id是创建readview时的max_trx_id(即尚未被分配的trx_id,这样在>=判断时就可以将读事务开启后提交的事务包含进来)即一定大于read_view_t->trx_ids中的最大值。当查询出一条记录后(记录上有一个trx_id,表示这条记录最后被修改时的事务id),可见性判断的逻辑如下(read_view_sees_trx_id):

1.如果记录上的trx_id小于read_view_t->up_limit_id,则说明这条记录的最后修改在readview创建之前,因此这条记录可以被看见。

2.如果记录上的trx_id大于等于read_view_t->low_limit_id,则说明这条记录的最后修改在readview创建之后,因此这条记录肯定不可以被看见。

3.如果记录上的trx_id在up_limit_id和low_limit_id之间,且trx_id在read_view_t->trx_ids之中,则表示这条记录的最后修改是在readview创建之时,被另外一个活跃事务所修改,所以这条记录也不可以被看见。如果trx_id不在read_view_t->trx_ids之中,则表示这条记录的最后修改在readview创建之后被提交,所以可以看到。

注意当隔离级别设置为READ UNCOMMITTED时,不会去构建老版本。

判断行记录可见行源码如下:

/*********************************************************************//**
Checks if a read view sees the specified transaction.
@return    true if sees */
UNIV_INLINE
bool
read_view_sees_trx_id(
/*==================*/
    const read_view_t*    view,    /*!< in: read view */
    trx_id_t        trx_id)    /*!< in: trx id */
{
    if (trx_id < view->up_limit_id) {

        return(true);
    } else if (trx_id >= view->low_limit_id) {

        return(false);
    } else {
        ulint    lower = 0;
        ulint    upper = view->n_trx_ids - 1;

        ut_a(view->n_trx_ids > 0);

        do {
            ulint        mid    = (lower + upper) >> 1;
            trx_id_t    mid_id    = view->trx_ids[mid];

            if (mid_id == trx_id) {
                return(FALSE);
            } else if (mid_id < trx_id) {
                if (mid > 0) {
                    upper = mid - 1;
                } else {
                    break;
                }
            } else {
                lower = mid + 1;
            }
        } while (lower <= upper);
    }

    return(true);
}

4.基于上述判断,如果记录不可见,则尝试使用undo去构建老的版本(row_vers_build_for_consistent_read),直到找到可以被看见的记录或者解析完所有的undo,代码如下:

dberr_t row_vers_build_for_consistent_read(...)
{
    ......
    for(;;){
        err = trx_undo_prev_version_build(rec, mtr,version,index,*offsets, heap,&prev_version);
        ......
        trx_id = row_get_rec_trx_id(prev_version, index, *offsets);
        // 如果当前row版本符合一致性视图,则返回
        if (read_view_sees_trx_id(view, trx_id)) {
            ......
            break;
        }
        // 如果当前row版本不符合,则继续回溯上一个版本(回到for循环的地方)
        version = prev_version;
    }
    ......
}

可见性分析如上已经差不多了,那么,不同隔离级别是怎么利用readview达到效果的呢?

针对RR隔离级别,在第一次创建readview(第一次调用select(不加锁))后,这个readview就会一直持续到事务结束,也就是说在事务执行过程中,数据的可见性不会变,所以在事务内部不会出现不一致的情况。针对RC隔离级别,事务中的每个查询语句都单独构建一个readview,所以如果两个查询之间有事务提交了,两个查询读出来的结果就不一样。从这里可以看出,在InnoDB中,RR隔离级别的效率是比RC隔离级别的高。此外,针对RU隔离级别,由于不会去检查可见性,所以在一条SQL中也会读到不一致的数据。针对串行化隔离级别,InnoDB是通过锁机制来实现的,而不是通过多版本控制的机制,所以性能很差。

 由下面代码可知,只有单纯的select才创建readview,select for update会加锁所以不会创建readview。

// 只有非锁模式的select才创建一致性视图
else if (prebuilt->select_lock_type == LOCK_NONE) {        // 创建一致性视图
        trx_assign_read_view(trx);
        prebuilt->sql_stat_start = FALSE;
}

也可参考下面描述:

参考资料:

https://my.oschina.net/alchemystar/blog/1927425

http://mysql.taobao.org/monthly/2017/12/01/

http://mysql.taobao.org/monthly/2015/12/01/

https://yq.aliyun.com/articles/560506

原文地址:https://www.cnblogs.com/restart30/p/11739464.html