卷起来！！！看了这篇文章我才知道MySQL事务MVCC到底是啥？（mysql事务是什么意思）

　　本篇文章为你整理了卷起来！！！看了这篇文章我才知道MySQL事务&MVCC到底是啥？（mysql事务是什么意思）的详细内容，包含有mvc事务应该在哪个层 mysql事务是什么意思事务 mysql 事务处理mysql 卷起来！！！看了这篇文章我才知道MySQL事务&MVCC到底是啥？，希望能帮助你了解卷起来！！！看了这篇文章我才知道MySQL事务&MVCC到底是啥？。

　　事务是一组操作的集合，它是一个不可分割的工作单位，事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求，即这些操作要么同时成功，要么同时失败。

　　
原子性（Atomicity）：事务是不可分割的最小操作单元，要么全部成功，要么全部失败。

　　一致性（Consistency）：事务完成时，必须使所有的数据都保持一致状态。

　　隔离性（Isolation）：数据库系统提供的隔离机制，保证事务在不受外部并发操作影响的独立环境下运行。

　　持久性（Durability）：事务一旦提交或回滚，它对数据库中的数据的改变就是永久的。

　　那实际上，我们研究事务的原理，就是研究MySQL的InnoDB引擎是如何保证事务的这四大特性的。

　　而对于这四大特性，实际上分为两个部分。其中的原子性、一致性、持久化，实际上是由InnoDB中的两份日志来保证的，一份是redo log日志，一份是undo log日志。而持久性是通过数据库的锁，加上MVCC来保证的。

　　接下来主要就是来研究一下redolog，undolog以及MVCC。

　　redo log

　　重做日志，记录的是事务提交时数据页的物理修改，是用来实现事务的持久性。

　　该日志文件由两部分组成：重做日志缓冲（redo log buffer）以及重做日志文件（redo log file）,前者是在内存中，后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中, 用于在刷新脏页到磁盘,发生错误时, 进行数据恢复使用。

　　如果没有redolog，可能会存在什么问题的？我们一起来分析一下。

　　我们知道，在InnoDB引擎中的内存结构中，主要的内存区域就是缓冲池，在缓冲池中缓存了很多的数据页。当我们在一个事务中，执行多个增删改的操作时，InnoDB引擎会先操作缓冲池中的数据，如果缓冲区没有对应的数据，会通过后台线程将磁盘中的数据加载出来，存放在缓冲区中，然后将缓冲池中的数据修改，修改后的数据页我们称为脏页。而脏页则会在一定的时机，通过后台线程刷新到磁盘中，从而保证缓冲区与磁盘的数据一致。而缓冲区的脏页数据并不是实时刷新的，而是一段时间之后将缓冲区的数据刷新到磁盘中，假如刷新到磁盘的过程出错了，而提示给用户事务提交成功，而数据却没有持久化下来，这就出现问题了，没有保证事务的持久性。

　　那么，如何解决上述的问题呢？在InnoDB中提供了一份日志 redo log，接下来我们再来分析一下，通过redolog如何解决这个问题。

　　有了redolog之后，当对缓冲区的数据进行增删改之后，会首先将操作的数据页的变化，记录在redo log buffer中。在事务提交时，会将redo log buffer中的数据刷新到redo log磁盘文件中。过一段时间之后，如果刷新缓冲区的脏页到磁盘时，发生错误，此时就可以借助于redo log进行数据恢复，这样就保证了事务的持久性。而如果脏页成功刷新到磁盘或或者涉及到的数据已经落盘，此时redolog就没有作用了，就可以删除了，所以存在的两个redolog文件是循环写的。

　　那为什么每一次提交事务，要刷新redo log 到磁盘中呢，而不是直接将buffer pool中的脏页刷新到磁盘呢 ?

　　因为在业务操作中，我们操作数据一般都是随机读写磁盘的，而不是顺序读写磁盘。而redo log在往磁盘文件中写入数据，由于是日志文件，所以都是顺序写的。顺序写的效率，要远大于随机写。这种先写日志的方式，称之为 WAL（Write-Ahead Logging）。

　　undo log

　　回滚日志，用于记录数据被修改前的信息 , 作用包含两个 : 提供回滚(保证事务的原子性) 和MVCC(多版本并发控制) 。

　　undo log和redo log记录物理日志不一样，它是逻辑日志。可以认为当delete一条记录时，undolog中会记录一条对应的insert记录，反之亦然，当update一条记录时，它记录一条对应相反的update记录。当执行rollback时，就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。

　　Undo log销毁：undo log在事务执行时产生，事务提交时，并不会立即删除undo log，因为这些日志可能还用于MVCC。

　　Undo log存储：undo log采用段的方式进行管理和记录，存放在前面介绍的 rollback segment回滚段中，内部包含1024个undo log segment。

　　读取的是记录的最新版本，读取时还要保证其他并发事务不能修改当前记录，会对读取的记录进行加锁。对于我们日常的操作，如：select ... lock in share mode(共享锁)，select ...for update、update、insert、delete(排他锁)都是一种当前读。

　　测试:

　　在测试中我们可以看到，即使是在默认的RR隔离级别下，事务A中依然可以读取到事务B最新提交的内容，因为在查询语句后面加上了 lock in share mode 共享锁，此时是当前读操作。当然，当我们加排他锁的时候，也是当前读操作。

　　简单的select（不加锁）就是快照读，快照读，读取的是记录数据的可见版本，有可能是历史数据，不加锁，是非阻塞读。

　　Read Committed：每次select，都生成一个快照读。

　　Repeatable Read：开启事务后第一个select语句才是快照读的地方。

　　Serializable：快照读会退化为当前读。

　　测试:

　　在测试中,我们看到即使事务B提交了数据,事务A中也查询不到。原因就是因为普通的select是快照读，而在当前默认的RR隔离级别下，开启事务后第一个select语句才是快照读的地方，后面执行相同的select语句都是从快照中获取数据，可能不是当前的最新数据，这样也就保证了可重复读。

　　全称 Multi-Version Concurrency Control，多版本并发控制。指维护一个数据的多个版本，使得读写操作没有冲突，快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现，还需要依赖于数据库记录中的三个隐式字段、undo log日志、readView。

　　接下来，我们再来介绍一下InnoDB引擎的表中涉及到的隐藏字段、undolog 以及 readview，从而来介绍一下MVCC的原理。

　　当我们创建了上面的这张表，我们在查看表结构的时候，就可以显式的看到这三个字段。实际上除了这三个字段以外，InnoDB还会自动的给我们添加三个隐藏字段及其含义分别是：

　　
而上述的前两个字段是肯定会添加的，是否添加最后一个字段DB_ROW_ID，得看当前表有没有主键，如果有主键，则不会添加该隐藏字段。

　　查看有主键的表 stu

　　进入服务器中的 /var/lib/mysql/MySQL_Advanced/ , 查看stu的表结构信息, 通过如下指令:

ibd2sdi stu.ibd

　　查看到的表结构信息中，有一栏 columns，在其中我们会看到处理我们建表时指定的字段以外，还有额外的两个字段分别是：DB_TRX_ID 、 DB_ROLL_PTR ，因为该表有主键，所以没有DB_ROW_ID隐藏字段。

　　 "name": "DB_TRX_ID",

　　 "type": 10,

　　 "is_nullable": false,

　　 "is_zerofill": false,

　　 "is_unsigned": false,

　　 "is_auto_increment": false,

　　 "is_virtual": false,

　　 "hidden": 2,

　　 "ordinal_position": 4,

　　 "char_length": 6,

　　 "numeric_precision": 0,

　　 "numeric_scale": 0,

　　 "numeric_scale_null": true,

　　 "datetime_precision": 0,

　　 "datetime_precision_null": 1,

　　 "has_no_default": false,

　　 "default_value_null": true,

　　 "srs_id_null": true,

　　 "srs_id": 0,

　　 "default_value": "",

　　 "default_value_utf8_null": true,

　　 "default_value_utf8": "",

　　 "default_option": "",

　　 "update_option": "",

　　 "comment": "",

　　 "generation_expression": "",

　　 "generation_expression_utf8": "",

　　 "options": "",

　　 "se_private_data": "table_id=1074;",

　　 "engine_attribute": "",

　　 "secondary_engine_attribute": "",

　　 "column_key": 1,

　　 "column_type_utf8": "",

　　 "elements": [],

　　 "collation_id": 63,

　　 "is_explicit_collation": false

　　 "name": "DB_ROLL_PTR",

　　 "type": 9,

　　 "is_nullable": false,

　　 "is_zerofill": false,

　　 "is_unsigned": false,

　　 "is_auto_increment": false,

　　 "is_virtual": false,

　　 "hidden": 2,

　　 "ordinal_position": 5,

　　 "char_length": 7,

　　 "numeric_precision": 0,

　　 "numeric_scale": 0,

　　 "numeric_scale_null": true,

　　 "datetime_precision": 0,

　　 "datetime_precision_null": 1,

　　 "has_no_default": false,

　　 "default_value_null": true,

　　 "srs_id_null": true,

　　 "srs_id": 0,

　　 "default_value": "",

　　 "default_value_utf8_null": true,

　　 "default_value_utf8": "",

　　 "default_option": "",

　　 "update_option": "",

　　 "comment": "",

　　 "generation_expression": "",

　　 "generation_expression_utf8": "",

　　 "options": "",

　　 "se_private_data": "table_id=1074;",

　　 "engine_attribute": "",

　　 "secondary_engine_attribute": "",

　　 "column_key": 1,

　　 "column_type_utf8": "",

　　 "elements": [],

　　 "collation_id": 63,

　　 "is_explicit_collation": false

　　查看没有主键的表 employee

　　建表语句：

create table employee (id int , name varchar(10));

　　此时，我们再通过以下指令来查看表结构及其其中的字段信息：

ibd2sdi employee.ibd

　　查看到的表结构信息中，有一栏 columns，在其中我们会看到处理我们建表时指定的字段以外，还有额外的三个字段分别是：DB_TRX_ID 、 DB_ROLL_PTR 、DB_ROW_ID，因为employee表是没有指定主键的。

　　 "name": "DB_ROW_ID",

　　 "type": 10,

　　 "is_nullable": false,

　　 "is_zerofill": false,

　　 "is_unsigned": false,

　　 "is_auto_increment": false,

　　 "is_virtual": false,

　　 "hidden": 2,

　　 "ordinal_position": 3,

　　 "char_length": 6,

　　 "numeric_precision": 0,

　　 "numeric_scale": 0,

　　 "numeric_scale_null": true,

　　 "datetime_precision": 0,

　　 "datetime_precision_null": 1,

　　 "has_no_default": false,

　　 "default_value_null": true,

　　 "srs_id_null": true,

　　 "srs_id": 0,

　　 "default_value": "",

　　 "default_value_utf8_null": true,

　　 "default_value_utf8": "",

　　 "default_option": "",

　　 "update_option": "",

　　 "comment": "",

　　 "generation_expression": "",

　　 "generation_expression_utf8": "",

　　 "options": "",

　　 "se_private_data": "table_id=1076;",

　　 "engine_attribute": "",

　　 "secondary_engine_attribute": "",

　　 "column_key": 1,

　　 "column_type_utf8": "",

　　 "elements": [],

　　 "collation_id": 63,

　　 "is_explicit_collation": false

　　 "name": "DB_TRX_ID",

　　 "type": 10,

　　 "is_nullable": false,

　　 "is_zerofill": false,

　　 "is_unsigned": false,

　　 "is_auto_increment": false,

　　 "is_virtual": false,

　　 "hidden": 2,

　　 "ordinal_position": 4,

　　 "char_length": 6,

　　 "numeric_precision": 0,

　　 "numeric_scale": 0,

　　 "numeric_scale_null": true,

　　 "datetime_precision": 0,

　　 "datetime_precision_null": 1,

　　 "has_no_default": false,

　　 "default_value_null": true,

　　 "srs_id_null": true,

　　 "srs_id": 0,

　　 "default_value": "",

　　 "default_value_utf8_null": true,

　　 "default_value_utf8": "",

　　 "default_option": "",

　　 "update_option": "",

　　 "comment": "",

　　 "generation_expression": "",

　　 "generation_expression_utf8": "",

　　 "options": "",

　　 "se_private_data": "table_id=1076;",

　　 "engine_attribute": "",

　　 "secondary_engine_attribute": "",

　　 "column_key": 1,

　　 "column_type_utf8": "",

　　 "elements": [],

　　 "collation_id": 63,

　　 "is_explicit_collation": false

　　 "name": "DB_ROLL_PTR",

　　 "type": 9,

　　 "is_nullable": false,

　　 "is_zerofill": false,

　　 "is_unsigned": false,

　　 "is_auto_increment": false,

　　 "is_virtual": false,

　　 "hidden": 2,

　　 "ordinal_position": 5,

　　 "char_length": 7,

　　 "numeric_precision": 0,

　　 "numeric_scale": 0,

　　 "numeric_scale_null": true,

　　 "datetime_precision": 0,

　　 "datetime_precision_null": 1,

　　 "has_no_default": false,

　　 "default_value_null": true,

　　 "srs_id_null": true,

　　 "srs_id": 0,

　　 "default_value": "",

　　 "default_value_utf8_null": true,

　　 "default_value_utf8": "",

　　 "default_option": "",

　　 "update_option": "",

　　 "comment": "",

　　 "generation_expression": "",

　　 "generation_expression_utf8": "",

　　 "options": "",

　　 "se_private_data": "table_id=1076;",

　　 "engine_attribute": "",

　　 "secondary_engine_attribute": "",

　　 "column_key": 1,

　　 "column_type_utf8": "",

　　 "elements": [],

　　 "collation_id": 63,

　　 "is_explicit_collation": false

　　undolog

　　回滚日志，在insert、update、delete的时候产生的便于数据回滚的日志。

　　当insert的时候，产生的undo log日志只在回滚时需要，在事务提交后，可被立即删除。

　　而update、delete的时候，产生的undo log日志不仅在回滚时需要，在快照读时也需要，不会立即被删除。

　　有一张表原始数据为：

　　DB_TRX_ID : 代表最近修改事务ID，记录插入这条记录或最后一次修改该记录的事务ID，是自增的。

　　DB_ROLL_PTR：由于这条数据是才插入的，没有被更新过，所以该字段值为null。

　　然后，有四个并发事务同时在访问这张表。

　　A. 第一步

　　当事务2执行第一条修改语句时，会记录undo log日志，记录数据变更之前的样子; 然后更新记录，并且记录本次操作的事务ID，回滚指针，回滚指针用来指定如果发生回滚，回滚到哪一个版本。

　　B.第二步

　　当事务3执行第一条修改语句时，也会记录undo log日志，记录数据变更之前的样子; 然后更新记录，并且记录本次操作的事务ID，回滚指针，回滚指针用来指定如果发生回滚，回滚到哪一个版本。

　　C. 第三步

　　当事务4执行第一条修改语句时，也会记录undo log日志，记录数据变更之前的样子; 然后更新记录，并且记录本次操作的事务ID，回滚指针，回滚指针用来指定如果发生回滚，回滚到哪一个版本。

　　最终我们发现，不同事务或相同事务对同一条记录进行修改，会导致该记录的undolog生成一条记录版本链表，链表的头部是最新的旧记录，链表尾部是最早的旧记录。

　　readview

　　ReadView（读视图）是快照读 SQL执行时MVCC提取数据的依据，记录并维护系统当前活跃的事务（未提交的）id。

　　ReadView中包含了四个核心字段：

　　
而在readview中就规定了版本链数据的访问规则：

　　trx_id 代表当前undolog版本链对应事务ID。

　　
READ COMMITTED ：在事务中每一次执行快照读时生成ReadView。

　　REPEATABLE READ：仅在事务中第一次执行快照读时生成ReadView，后续复用该ReadView。

　　RC隔离级别

　　RC隔离级别下，在事务中每一次执行快照读时生成ReadView。

　　我们就来分析事务5中，两次快照读读取数据，是如何获取数据的?

　　在事务5中，查询了两次id为30的记录，由于隔离级别为Read Committed，所以每一次进行快照读都会生成一个ReadView，那么两次生成的ReadView如下。

　　那么这两次快照读在获取数据时，就需要根据所生成的ReadView以及ReadView的版本链访问规则，到undolog版本链中匹配数据，最终决定此次快照读返回的数据。

　　A. 先来看第一次快照读具体的读取过程：

　　在进行匹配时，会从undo log的版本链，从上到下进行挨个匹配：

　　这条记录，这条记录对应的trx_id为4，也就是将4带入右侧的匹配规则中。 ①不满足 ②不满足 ③不满足 ④也不满足，都不满足，则继续匹配undo log版本链的下一条。

　　再匹配第二条

　　，这条记录对应的trx_id为3，也就是将3带入右侧的匹配规则中。①不满足 ②不满足 ③不满足 ④也不满足，都不满足，则继续匹配undo log版本链的下一条。

　　再匹配第三条

　　，这条记录对应的trx_id为2，也就是将2带入右侧的匹配规则中。①不满足 ②满足终止匹配，此次快照读，返回的数据就是版本链中记录的这条数据。

　　B. 再来看第二次快照读具体的读取过程:

　　在进行匹配时，会从undo log的版本链，从上到下进行挨个匹配：

　　再匹配第二条

　　，这条记录对应的trx_id为3，也就是将3带入右侧的匹配规则中。①不满足 ②满足。终止匹配，此次快照读，返回的数据就是版本链中记录的这条数据。

　　RR隔离级别

　　RR隔离级别下，仅在事务中第一次执行快照读时生成ReadView，后续复用该ReadView。而RR 是可重复读，在一个事务中，执行两次相同的select语句，查询到的结果是一样的。

　　那MySQL是如何做到可重复读的呢? 我们简单分析一下就知道了

　　我们看到，在RR隔离级别下，只是在事务中第一次快照读时生成ReadView，后续都是复用该ReadView，那么既然ReadView都一样， ReadView的版本链匹配规则也一样，那么最终快照读返回的结果也是一样的。

　　所以呢，MVCC的实现原理就是通过 InnoDB表的隐藏字段、UndoLog 版本链、ReadView来实现的。而MVCC + 锁，则实现了事务的隔离性。而一致性则是由redolog 与 undolog保证。

　　本文由传智教育博学谷狂野架构师教研团队发布。

　　如果本文对您有帮助，欢迎关注和点赞；如果您有任何建议也可留言评论或私信，您的支持是我坚持创作的动力。

　　转载请注明出处！

　　以上就是卷起来！！！看了这篇文章我才知道MySQL事务&MVCC到底是啥？（mysql事务是什么意思）的详细内容，想要了解更多卷起来！！！看了这篇文章我才知道MySQL事务&MVCC到底是啥？的内容，请持续关注盛行IT软件开发工作室。

郑重声明：本文由网友发布，不代表盛行IT的观点，版权归原作者所有，仅为传播更多信息之目的，如有侵权请联系，我们将第一时间修改或删除，多谢。

相关文章阅读