MySQL索引

搬运自景女神博客园

什么是索引

索引在MySQL中也叫是一种“键”,是存储引擎用于快速找到记录的一种数据结构。索引对于良好的性能非常关键,尤其是当表中的数据量越来越大时,索引对于性能的影响愈发重要。
索引优化应该是对查询性能优化最有效的手段了。索引能够轻易将查询性能提高好几个数量级。
索引相当于字典的音序表,如果要查某个字,如果不使用音序表,则需要从几百页中逐页去查。

索引的原理

索引的目的在于提高查询效率,与我们查阅图书所用的目录是一个道理:先定位到章,然后定位到该章下的一个小节,然后找到页数。相似的例子还有:查字典,查火车车次,飞机航班等

本质都是:通过不断地缩小想要获取数据的范围来筛选出最终想要的结果,同时把随机的事件变成顺序的事件,也就是说,有了这种索引机制,我们可以总是用同一种查找方式来锁定数据。

磁盘IO与预读

简单介绍一下磁盘IO和预读,磁盘读取数据靠的是机械运动,每次读取数据花费的时间可以分为寻道时间、旋转延迟、传输时间三个部分,寻道时间指的是磁臂移动到指定磁道所需要的时间,主流磁盘一般在5ms以下;旋转延迟就是我们经常听说的磁盘转速,比如一个磁盘7200转,表示每分钟能转7200次,也就是说1秒钟能转120次,旋转延迟就是1/120/2 = 4.17ms;传输时间指的是从磁盘读出或将数据写入磁盘的时间,一般在零点几毫秒,相对于前两个时间可以忽略不计。那么访问一次磁盘的时间,即一次磁盘IO的时间约等于5+4.17 = 9ms左右,听起来还挺不错的,但要知道一台500 -MIPS(Million Instructions Per Second)的机器每秒可以执行5亿条指令,因为指令依靠的是电的性质,换句话说执行一次IO的时间可以执行约450万条指令,数据库动辄十万百万乃至千万级数据,每次9毫秒的时间,显然是个灾难。
预读的原因

考虑到磁盘IO是非常高昂的操作,计算机操作系统做了一些优化,当一次IO时,不光把当前磁盘地址的数据,而是把相邻的数据也都读取到内存缓冲区内,因为局部预读性原理告诉我们,当计算机访问一个地址的数据的时候,与其相邻的数据也会很快被访问到。每一次IO读取的数据我们称之为一页(page)。具体一页有多大数据跟操作系统有关,一般为4k或8k,也就是我们读取一页内的数据时候,实际上才发生了一次IO,这个理论对于索引的数据结构设计非常有帮助。

索引的数据结构

b树  

balance tree

树状图是一种数据结构,它是由n(n>=1)个有限结点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
它具有以下的特点:每个结点有零个或多个子结点;没有父结点的结点称为根结点;每一个非根结点有且只有一个父结点;除了根结点外,每个子结点可以分为多个不相交的子树
                            
根结点 : A   
父节点 : A是B,C的父节点
叶子节点:D,E是叶子节点
树的深度/树的高度:高度为3

b+树

高度可控的多路搜索树

 b+树是通过二叉查找树,再由平衡二叉树,b树演化而来

b+树特点

数据只储存在叶子节点

在子节点之间加入了双线连接,更方便的在子节点之间进行数据的读取

聚集索引和辅助索引

数据库中的B+树索引可以分为聚集索引(clustered index)和辅助索引(secondary index),

聚集索引与辅助索引相同的是:不管是聚集索引还是辅助索引,其内部都是B+树的形式,即高度是平衡的,叶子结点存放着所有的数据。

聚集索引与辅助索引不同的是:叶子结点存放的是否是一整行的信息

辅助索引

创建的索引列的数据储存在树形结构的叶子节点上

储存的内容:索引列 + id列

聚集索引

直接把整行数据写到叶子节点上

不同引擎的索引

innodb引擎

聚集索引  只有一个主键

辅助索引  除了主键之外的所有索引都是辅助索引  (回表:只查询一个索引不能解决查询的问题,还需要到具体的表中去获取整行数据)

myisam引擎

都是辅助索引

MySQL常用索引

primary key  主键的创建自带索引效果  非空 + 唯一 + 聚集索引

unique  唯一约束的创建自带索引效果  唯一 + 辅助索引

index  普通的索引  辅助索引

基本语法

创建索引
create index 索引名字 on 表(字段);

删除索引
drop index 索引名字 on 表;

索引的优缺点

优点

查找速度快,创建了索引之后查找的效率大幅度提高

缺点

浪费空间,文件所占的硬盘的资源大幅度提高,拖慢写的速度(不要在程序中创建无用的索引)

索引正确的使用方式(怎样命中索引?哪些情况会造成索引不命中?)

1. 所查询的列不是创建了索引的列

2. 在条件中不能带运算或者函数,必须是"字段 = 值"

3. 如果创建索引的列的重复率高(性别,部门),也不能有效利用索引(重复率不超过10%的列比较适合做索引)

4. 数据对应的范围如果太大的话,也不能有效利用索引(不能带 < , > , != , not in 等)

5. like如果把%放在最前面也不能命中索引

6. 多条件的情况

    and  只要有一个条件列是索引列就可以命中索引

    or     只有所有的条件列都是索引才能命中索引

7. 如果是联合索引,要遵循最左前缀规则

联合索引

对a和b都创建索引

create index ind_mix on (a,b);

在多个条件相连的情况下,使用联合索引的效率要高于使用单字段的索引

1. 创建索引的顺序是a,b,条件从哪一个字段开始出现了范围,索引就失效了

2. 联合索引在使用时遵循最左前缀原则(有a就能命中索引)

3. 联合索引中只有使用and能生效,使用or失效

MySQL收尾

执行计划

explain sql语句

查看sql语句的执行计划(是否命中索引,命中索引类型等)

覆盖索引

查的条件时索引列,并且显示的是查的条件相关的列

explain sql语句 如果看见 using index 表示覆盖索引

索引合并

创建的时候分开创建,用的时候临时合并到一起了

explain sql语句 如果看见 using union 表示索引合并

慢日志

MySQL日志管理
========================================================
错误日志: 记录 MySQL 服务器启动、关闭及运行错误等信息
二进制日志: 又称binlog日志,以二进制文件的方式记录数据库中除 SELECT 以外的操作
查询日志: 记录查询的信息
慢查询日志: 记录执行时间超过指定时间的操作
中继日志: 备库将主库的二进制日志复制到自己的中继日志中,从而在本地进行重放
通用日志: 审计哪个账号、在哪个时段、做了哪些事件
事务日志或称redo日志: 记录Innodb事务相关的如事务执行时间、检查点等
========================================================
一、bin-log
1. 启用
# vim /etc/my.cnf
[mysqld]
log-bin[=dir[filename]]
# service mysqld restart
2. 暂停
//仅当前会话
SET SQL_LOG_BIN=0;
SET SQL_LOG_BIN=1;
3. 查看
查看全部:
# mysqlbinlog mysql.000002
按时间:
# mysqlbinlog mysql.000002 --start-datetime="2012-12-05 10:02:56"
# mysqlbinlog mysql.000002 --stop-datetime="2012-12-05 11:02:54"
# mysqlbinlog mysql.000002 --start-datetime="2012-12-05 10:02:56" --stop-datetime="2012-12-05 11:02:54" 

按字节数:
# mysqlbinlog mysql.000002 --start-position=260
# mysqlbinlog mysql.000002 --stop-position=260
# mysqlbinlog mysql.000002 --start-position=260 --stop-position=930
4. 截断bin-log(产生新的bin-log文件)
a. 重启mysql服务器
b. # mysql -uroot -p123 -e 'flush logs'
5. 删除bin-log文件
# mysql -uroot -p123 -e 'reset master' 


二、查询日志
启用通用查询日志
# vim /etc/my.cnf
[mysqld]
log[=dir[filename]]
# service mysqld restart

三、慢查询日志
启用慢查询日志
# vim /etc/my.cnf
[mysqld]
log-slow-queries[=dir[filename]]
long_query_time=n
# service mysqld restart
MySQL 5.6:
slow-query-log=1
slow-query-log-file=slow.log
long_query_time=3  单位为秒
查看慢查询日志
测试:BENCHMARK(count,expr)
SELECT BENCHMARK(50000000,2*3);

日志管理
日志管理

慢日志通过配置文件开启

数据库/表的导入导出

备份表 :homwork库中的所有表和数据
    mysqldump -uroot -p123 work > D:day42a.sql
    备份单表
    mysqldump -uroot -p123 work course > D:day42a.sql

备份库 :
    mysqldump -uroot -p123 --databases work > D:day42db.sql

恢复数据:
    进入mysql 切换到要恢复数据的库下面
    sourse D:day42a.sql
sql语句

事务

开启事务,给数据加锁,防止数据被多个人同时修改

begin;
select id from t1 where name = 'alex' for update;
update t1 set id = 2 where name = 'alex';
commit;
sql语句

多表联查速度慢怎么办

1. 从表结构的角度

  尽量用固定长度的数据类型代替可变长数据类型

  把固定长度的字段放前面

2. 从数据的角度

  表中的数据越多,查询速度就越慢

  列多:垂直分表  行多:水平分表

3. 从sql的角度

  尽量把条件写的细致,where条件多做筛选

  多表尽量用连表代替子查询

  创建有效的索引,规避无效的索引

4. 从配置的角度

  开启慢日志查询,确认具体的有问题的sql语句并修改

5. 从数据库的角度

  读写分离(解决数据库读的瓶颈)

原文地址:https://www.cnblogs.com/biulo/p/11316801.html