MySQL系列(三)--MySQL存储引擎

影响数据库性能的因素:

1、硬件环境:CPU、内存、存盘IO、网卡流量等

2、存储引擎的选择

3、数据库参数配置(影响最大)

4、数据库结构设计和SQL语句

MySQL采用插件式存储引擎,可以自行选择,但同时如何选择也成了问题,本文会介绍存储引擎的特点,以及如何选择

MySQL体系结构:

Server用来实现所有与存储引擎无关的事:比如,查询语句

MySQL所支持的存储引擎如下:通过show engines查询

MyISAM:MySQL5.5版本之前默认的存储引擎

MyISAM的表由FRM(存储表定义)、MYD(数据文件)和MYI(索引文件)组成,后面两个为MyISAM独有的

特性:

1、并发性和锁级别:

  使用表级锁,对数据进行读取和修改的时候,都会对表进行加锁,读写互斥,对读写混合的并发不好,对只读的并发还可以

2、表损坏修复:

  支持对意外关闭导致损坏的表进行检查和修复(不是事务恢复,因为MyISAM不是事务型引擎,没有事务恢复的相关日志),通过

check table tablename和repair table tablename进行检查和修复,也可以通过MyISAMCHK进行修复,但是一定要先将mysql服务停止

3、支持全文索引:

  是5.7版本之前唯一原生就支持全文索引的引擎

4、对只读表可以进行数据压缩:

  通过MyISAMPack对文件进行压缩,压缩过后就变成只读表了,不能修改数据

5、独有的系统表和临时表

临时表是指在排序、分组等操作中,当数据超过一定大小时,由查询优化器创建的临时表,而不是CREATE TEMPORARY TABLE创建这种临时表

限制:

  1、5.0版本之前默认表大小为4G,想要存储更大的表要修改MAX_rows和AVG_ROW_LENGTH,相乘就是表大小

  2、5.0版本之后默认256T

使用场景:

  1、不支持事务的应用

  2、只读类应用,可以对文件的压缩

  3、5.0之前,只有MyISAM支持空间类应用,可以存储例如GPS型数据

  4、大数据select场景

InnoDB:5.5版本之后默认存储引擎,代替了MyISAM

特性:

  1、支持事务,支持ACID特性,通过Redo Log(已提交的事务)和Undo Log(未提交的事务)

  2、支持行级锁,在存储引擎层实现,可以支持更大的并发

  3、使用表空间进行数据存储:通过show variables like 'innodb_file_per_table';进行查看

  值为ON,为每个表创建一个表空间:tablename.ibd

  值为OFF,使用系统表空间ibdataX(X为数字,1,2,3,4,5)

如何选择表空间存储方式:

  1、5.5之前默认使用系统表空间,表空间大小不会变,即使磁盘空间不足,主动删除一些信息,表空间不会改变

  2、独立表空间可以通过命令:optimize table来收缩系统文件

  3、系统表空间可能会存在IO瓶颈

  4、独立表空间可以同时向多个文件刷新数据,IO问题要小得多

V5.6之后,独立表空间变成默认,也是建议使用的

MyISAM与InnoDB区别:

  1).InnoDB支持事务,MyISAM不支持

  2).MyISAM适合查询以及插入为主的应用,InnoDB适合频繁修改以及涉及到安全性较高的应用

  3).InnoDB支持外键,MyISAM不支持

  4).V5.7版本之后,InnoDB支持了全文索引和空间函数,所以MyISAM使用场景越来越少,一般都是使用InnoDB

  5).InnoDB中不保存表的行数,如select count(*) from table时,InnoDB需要扫描一遍整个表来计算有多少行,但是MyISAM只要简单的读

好的行数即可。注意的是,当count(*)语句包含where条件时MyISAM也需要扫描整个表

  6).MYISAM的性能更优,占用的存储空间少.MYISAM索引和数据是分开的,而且其索引是压缩的,可以更好地利用内存。所以它的查询性能明

显优于INNODB

  7).对于自增长的字段,InnoDB中必须包含只有该字段的索引,但是在MyISAM表中可以和其他字段一起建立联合索引

  8).清空整个表时,InnoDB是一行一行的删除,效率非常慢。MyISAM则会重建表

  9).MyISAM只支持表级锁,InnoDB支持行锁和表级锁(select语句中SQL没有使用索引的话,使用的表级锁,使用索引,就是行级锁

CSV:

  1、CSV可以将CSV文件当做MySQL表进行处理,CSV数据是以CSV文件的格式进行存储

  2、所有列必须都是非空的

  3、不支持索引

  4、可以对数据文件直接进行编辑,其他存储引擎的数据都是以二进制的形式进行存储

使用场景:

  适合作为数据交换的中间表,例如可以将Excel的数据存储为CSV文件,直接复制到MySQL目录,就可以直接打开使用,反过来也是一样的

Archive:

  1、以zlib对表数据进行压缩,比MyISAM占用的磁盘IO更少

  2、数据存储在.ARZ文件中,.frm存储表结构信息

  3、只支持insert和select操作,支持高并发

  4、只支持在自增ID上加索引

使用场景:

  日志和数据采集类的应用

Memory:

  也被称为heap存储引擎,数据都是保存在内存当中,所以只存在.frm文件

  1、MySQL重启之后,Memory存储引擎对应的表数据都会消失,但是表结构存在,因为保存在.frm文件中

  2、支持hash索引和B-Tree索引,默认hash索引(使用=查询),如果更多的是范围查询使用B-Tree索引

  3、所有字段的长度都是固定的,例如

  4、不能使用BLOG和TEXT这类大字段

  5、使用的是表级锁

  6、MEMORY支持AUTO_INCREMENT列和对可包含NULL值的列的索引

  7、存储数据最大大小由max_heap_table_size参数决定,可以自行修改

使用场景:

  1、适用于等值查找,可用于查找和映射表,邮编和地区的映射

  2、保存数据分析的中间表

  3、缓存周期性聚合数据的结果表

总体就是:因为Memory的数据容易丢失,要求数据可再生

PS:主从复制不能保证Memory数据,master重启会重建表,slave也会重建的

如何选择存储引擎:

1、应用需要事务支持,就选用InnoDB

2、应用是否需要数据备份,一般生产环境都需要热备,也是InnoDB

3、崩溃恢复,InnoDB也比MyISAM更稳定

4、上面都不考虑的情况下,再考虑存储引擎的特性,特性再上面都已经基本总结到了

PS:尽量不要混合使用存储引擎,不然可能发生很奇怪的问题

原文地址:https://www.cnblogs.com/huigelaile/p/11061909.html