脏读和幻读(幻读和不可重复读)

第二十章幻读是什么，幻读有什么问题？

CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `c` int(11) DEFAULT NULL,
  `d` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `c` (`c`)
) ENGINE=InnoDB;

insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);

下面的语句序列，是怎么加锁的，加的锁又是什么时候释放的呢 ?

begin;
select * from t where d=5 for update;
commit;

select ... for update：

对于非索引字段进行 update 或 select .. for update 操作，代价极高。所有记录上锁，以及所有间隔的锁对于索引字段进行上述操作，代价一般。只有索引字段本身和附近的间隔会被加锁select ... for update 是为了在查询时，对这条数据进行加锁，避免其他用户以该表进行插入、修改或删除等操作，造成表的不一致性

关于 “这个语句会命中 d=5 的这一行，对应的主键 id=5，因此在 select 语句执行完成后，id=5 这一行会加一个写锁，而且由于两阶段锁协议，这个写锁会在执行 commit 语句的时候释放” 这句话的理解

由于字段 d 上没有索引，因此这条查询语句会做全表扫描。那么，其他被扫描到的，但是不满足条件的 5 行记录上，会不会被加锁呢？

RR (可重复读) 级别：扫描到的数据都会加行锁和间隙锁RC (读提交) 级别：扫描到的数据都会加行锁，但是不满足条件的数据，没有到 commit 阶段，就会被释放，违反了两阶段加锁原则全表扫描一直指的是扫描主键索引什么是幻读 ?

InnoDB 的默认隔离级别是可重复读

share in mode：当前读，给数据加读锁

for update：当前读，给数据加写锁

什么是幻读 ?

在同一个事务中，两次读取到的数据不一致的情况，称为幻读和不可重复读幻读是针对 insert 导致的数据不一致不可重复读是针对 delete、update 导致的数据不一致可重复读隔离级别下，事务内查询用 “当前读”，读到本事务外新增的数据，称为幻读幻读是用户在使用可重复读隔离级别下，在进行 select 查询时加 IX锁、IS锁才可能出现的，是用户主动打破业务层面上的查询时的一致性视图隔离性其不属于事务隔离的可见性规则问题（可见性规则是来解决各种事务问题的），而是用户在使用上出现的问题，属于业务问题

什么是快照读 ? 什么是当前读 ?

当前读指的是 select for update 或者 select in share mode ，指的是在更新之前必须先查询当前的值，因此叫当前读快照读指的是在语句执行之前或者在事务开始的时候会创建一个视图，后面的读都是基于这个视图的，不会再去查询最新的值

当前读具体包括哪些操作 ?

for update、lock in share mode、update、delete、insert 都是当前读的规则，就是读取最新的已经提交的数据update 先查询再修改，这里的查询就是使用的当前读delete 要先查询再删除，这里的查询也是要当前读insert 的时候，要判断主键是否已经存在、是否违反唯一约束，此时查看主键是否存在的查询也是当前读

幻读和脏读的区别 ?

幻读是读到了提交了的数据，而脏读是读到了没提交的脏数据在读提交的隔离级别下，没有讨论幻读的实际意义而在可重复读隔离级别下，当前读打破了视图的隔离限制，实现了读到不应该读的数据的作用

在可重复读的隔离级别下，幻读只会在查询为哪种性质时才会出现 ?

由于一致性视图的作用，因此幻读只会在 “当前读” 情况下发生

幻读跟事务的可见性规则冲突吗 ?

在可重复读隔离级别下，幻读是用户选择使用当前读而产生的，符合当前读的规则，也不跟事务的可见性规则相矛盾幻读有什么问题 ?

select .. lock in share mode 和 select ... for update 的区别 ?

select .. lock in share mode 走的是 IS锁（意向锁）

即在符合条件的 rows 上都加了共享锁，这样的话，其他 session 可以读取这些记录，也可以继续添加 IS 锁，但是无法修改这些记录直到你这个加锁的 session 执行完成 (否则直接锁等待超时) select ... for update 走的是 IX锁 (意向排它锁)

即在符合条件的 rows 上都加了排它锁，其他 session 也就无法在这些记录上添加任何的IS锁或 IX锁如果不存在一致性非锁定读的话，那么其他 session 是无法读取和修改这些记录的但是 innoDB 存在非锁定读 (快照读并不需要加锁)，for update 之后并不会阻塞其他 session 的快照读取操作除了 select ...lock in share mode 和 select ... for update 这种显示加锁的查询操作通过对比，发现 for update 的加锁方式无非是比 lock in share mode 的方式多阻塞了select...lock in share mode 的查询方式，并不会阻塞快照读

幻读产生的原因 ?

注意：binlog 日志是在 commit 提交时才进行记录的即使给所有行加上了锁，也避免不了幻读这是因为给行加锁的时候，这条记录还不存在，没法加锁例如下面这种情况：假设扫描到的行都被加上了行锁

由于 session A 把所有的行都加了写锁，所以 session B 在执行第一个 update 语句的时候就被锁住了，需要等到 T6 时刻 session A 提交以后，session B 才能继续执行在 binlog 里面，执行序列是这样的：

insert into t values(1,1,5); 
update t set c=5 where id=1; 

update t set d=100 where d=5;

update t set d=5 where id=0; 
update t set c=5 where id=0;

按照日志顺序执行，id=0 这一行的最终结果也是 (0,5,5)。所以，id=0 这一行的问题解决了但是你可以看到，id=1 这一行，在数据库里面的结果是 (1,5,5)，而根据 binlog 的执行结果是 (1,5,100)，也就是说幻读的问题还是没有得到解决

原因是：在 T3 时刻，我们给所有行加锁的时候，id=1 这一行还不存在，不存在也就加不上锁如何解决幻读 ?

如何解决幻读 ?

InnoDB 在行锁的基础上，引入了间隙锁 (Gap Lock)间隙锁，锁的就是两个值之间的空隙比如文章开头的表 t，初始化插入了 6 个记录，这就产生了 7 个间隙

insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);

MySQL 会对扫描经过的索引对象，加上间隙锁

行锁和行锁之间会产生冲突，那间隙锁和间隙锁之间，也会产生冲突吗 ?

行锁分为：读锁、写锁

行锁：读锁之间不冲突，写锁与读锁冲突，写锁与写锁冲突但是，跟间隙锁存在冲突关系的，是 “往这个间隙中插入一个记录” 这个操作间隙锁与间隙锁之间，都不存在冲突关系

什么是 next-key lock ?

间隙锁和行锁合称 next-key lock，每个 next-key lock 是前开后闭区间如果用 select * from t for update 要把整个表所有记录锁起来，就形成了 7 个 next-key lock，分别是 (-∞,0]、(0,5]、(5,10]、(10,15]、(15,20]、(20, 25]、(25, +supremum]间隙锁只是锁间隙，没有锁住记录行，而 next-key lock 就是间隙锁基础上锁住右边界行间隙锁：( ) 开区间next-key lock：( ] 前开后闭区间如果是表的最后一行数据，则下一个区间是这行数据到表索引的不存在的最大值，也就是 +supremum

引入间隙锁后，可能会导致什么问题 ?

首先需要了解间隙锁的特性：锁的是间隙，是禁止其他操作往间隙中插入数据的。因此间隙锁与间隙锁之间不冲突所以在 AB 两个事务当中A事务随机查询某一条数据（+排它锁，也就是 for update ）的方式产生间隙锁B事务也执行同一条SQL，随后 A事务判定数据不存在时，对其插入，B事务也同样如此操作，则最终导致 A事务等待 B事务的间隙锁，B事务也在等待 A事务的间隙锁，这将导致死锁当然，由于 InnoDB 有开启死锁检测，最后 A事务报错返回但是，间隙锁会影响数据的并发度

除了引入间隙锁，还有什么方式可以解决幻读 ?

将 RR (可重复读) 改为 RC (读提交)，则不存在幻读问题但此时需要将 binlog 格式改为 row，否则可能出现数据和日志不一致的问题

为什么 RC (读提交) 下，需要将 binlog 格式改为 row 呢 ?

RC 没有幻读问题，也没有间隙锁，但在显示控制事务更新时若在事务A 还未提交之前，有别的事务B 后执行并且添加的数据是事务A 的更新语句逻辑层面会命中的条件那等事务A 提交之后，statement 的 binlog 记录上，事务B的记录在前，而事务A的记录在后（这没毛病，谁先提交谁先记录，但恢复的时候会产生问题）当执行日志恢复时，后提交的事务A 的记录会把事务B 的记录也进行更新，这就导致了数据恢复错误此时，如果改成 row 格式，binlog 会具体记录语句的各项条件，这样在恢复时便不会恢复错误了注意：除了恢复，还有主从库的同步也会有这个问题举个例子：例子一：删除 statement 记录的是这个删除的语句

delete from t where age>10 and modified_time<='2020-03-04' limit 1;

而 row 格式记录的是实际受影响的数据是真实删除行的主键id

delete from t where id=3 and age=12 and modified_time='2020-03-05';

例子二：

-- statemnt格式
begin；
update t set d=5 where id=0;
commit;

-- row格式
begin；
update t where id=0 and c=0 and d=0
set id=0,c=0,d=5
commit;

关于row格式的参考资料

为什么要把MySQL的binlog格式修改为row

大家都用读提交，可是逻辑备份的时候，mysqldump 为什么要把备份线程设置成可重复读呢 ?

官方自带的逻辑备份工具是 mysqldump当 mysqldump 使用参数 –single-transaction 的时候，导数据之前就会启动一个事务，来确保拿到一致性视图因为 RR (可重复读) 的一致性读视图可以保证数据备份时，不阻塞其他数据写入

在备份期间，备份线程用的是可重复读，而业务线程用的是读提交。同时存在两种事务隔离级别，会不会有问题 ?

没有问题，不管是读提交还是可重复读，都是 MVCC 支持备份是从某个快照时间之后开始的，数据是固定一致准确的

一条加了排它锁的查询语句，如果查询是全表扫描，那么扫描过的语句会如何 ?

在可重复读隔离级别下，MySQL 会对扫过的语句加 next-key lock 总结

可重复读更新时采用当前读，这是为了防止数据丢失但使用当前读，可能造成更新层面语义的破坏和日志数据不一致的问题为解决更新层面的幻读问题，可重复读时，引入了 next-key lock若是直接采取读提交，则解决了语义层面的破坏，但需要通过将 binlog 改为 max 或 row 的形式，防止日志数据不一致

脏读和幻读(幻读和不可重复读)

Java相关栏目本月热门文章