MySQL索引

什么是索引

索引在MySQL中也叫是一种“键”，是存储引擎用于快速找到记录的一种数据结构。索引对于良好的性能非常关键，尤其是当表中的数据量越来越大时，索引对于性能的影响愈发重要。
索引优化应该是对查询性能优化最有效的手段了。索引能够轻易将查询性能提高好几个数量级。
索引相当于字典的音序表，如果要查某个字，如果不使用音序表，则需要从几百页中逐页去查。

索引的原理

索引的目的在于提高查询效率，与我们查阅图书所用的目录是一个道理：先定位到章，然后定位到该章下的一个小节，然后找到页数。相似的例子还有：查字典，查火车车次，飞机航班等

本质都是：通过不断地缩小想要获取数据的范围来筛选出最终想要的结果，同时把随机的事件变成顺序的事件，也就是说，有了这种索引机制，我们可以总是用同一种查找方式来锁定数据。

磁盘IO与预读

简单介绍一下磁盘IO和预读，磁盘读取数据靠的是机械运动，每次读取数据花费的时间可以分为寻道时间、旋转延迟、传输时间三个部分，寻道时间指的是磁臂移动到指定磁道所需要的时间，主流磁盘一般在5ms以下；旋转延迟就是我们经常听说的磁盘转速，比如一个磁盘7200转，表示每分钟能转7200次，也就是说1秒钟能转120次，旋转延迟就是1/120/2 = 4.17ms；传输时间指的是从磁盘读出或将数据写入磁盘的时间，一般在零点几毫秒，相对于前两个时间可以忽略不计。那么访问一次磁盘的时间，即一次磁盘IO的时间约等于5+4.17 = 9ms左右，听起来还挺不错的，但要知道一台500 -MIPS（Million Instructions Per Second）的机器每秒可以执行5亿条指令，因为指令依靠的是电的性质，换句话说执行一次IO的时间可以执行约450万条指令，数据库动辄十万百万乃至千万级数据，每次9毫秒的时间，显然是个灾难。

预读的原因

考虑到磁盘IO是非常高昂的操作，计算机操作系统做了一些优化，当一次IO时，不光把当前磁盘地址的数据，而是把相邻的数据也都读取到内存缓冲区内，因为局部预读性原理告诉我们，当计算机访问一个地址的数据的时候，与其相邻的数据也会很快被访问到。每一次IO读取的数据我们称之为一页(page)。具体一页有多大数据跟操作系统有关，一般为4k或8k，也就是我们读取一页内的数据时候，实际上才发生了一次IO，这个理论对于索引的数据结构设计非常有帮助。

索引的数据结构

b树　　

balance tree

树状图是一种数据结构，它是由n（n>=1）个有限结点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

它具有以下的特点：每个结点有零个或多个子结点；没有父结点的结点称为根结点；每一个非根结点有且只有一个父结点；除了根结点外，每个子结点可以分为多个不相交的子树

根结点 : A

父节点 : A是B,C的父节点

叶子节点：D,E是叶子节点

树的深度/树的高度：高度为3

b+树

高度可控的多路搜索树

b+树是通过二叉查找树，再由平衡二叉树，b树演化而来

b+树特点

数据只储存在叶子节点

在子节点之间加入了双线连接，更方便的在子节点之间进行数据的读取

聚集索引和辅助索引

数据库中的B+树索引可以分为聚集索引（clustered index）和辅助索引（secondary index），

聚集索引与辅助索引相同的是：不管是聚集索引还是辅助索引，其内部都是B+树的形式，即高度是平衡的，叶子结点存放着所有的数据。

聚集索引与辅助索引不同的是：叶子结点存放的是否是一整行的信息

辅助索引

创建的索引列的数据储存在树形结构的叶子节点上

储存的内容：索引列 + id列

聚集索引

直接把整行数据写到叶子节点上

不同引擎的索引

innodb引擎

聚集索引　　只有一个主键

辅助索引　　除了主键之外的所有索引都是辅助索引　　（回表：只查询一个索引不能解决查询的问题，还需要到具体的表中去获取整行数据）

myisam引擎

都是辅助索引

MySQL常用索引

primary key　　主键的创建自带索引效果　　非空 + 唯一 + 聚集索引

unique　　唯一约束的创建自带索引效果　　唯一 + 辅助索引

index　　普通的索引　　辅助索引

基本语法

创建索引
create index 索引名字 on 表(字段);

删除索引
drop index 索引名字 on 表;

索引的优缺点

优点

查找速度快，创建了索引之后查找的效率大幅度提高

缺点

浪费空间，文件所占的硬盘的资源大幅度提高，拖慢写的速度（不要在程序中创建无用的索引）

索引正确的使用方式（怎样命中索引？哪些情况会造成索引不命中？）

1. 所查询的列不是创建了索引的列

2. 在条件中不能带运算或者函数，必须是"字段 = 值"

3. 如果创建索引的列的重复率高（性别，部门），也不能有效利用索引（重复率不超过10％的列比较适合做索引）

4. 数据对应的范围如果太大的话，也不能有效利用索引（不能带 < , > , != , not in 等）

5. like如果把%放在最前面也不能命中索引

6. 多条件的情况

　　　　and　　只要有一个条件列是索引列就可以命中索引

　　　　or　　只有所有的条件列都是索引才能命中索引

7. 如果是联合索引，要遵循最左前缀规则

联合索引

对a和b都创建索引

create index ind_mix on (a,b);

在多个条件相连的情况下，使用联合索引的效率要高于使用单字段的索引

1. 创建索引的顺序是a,b，条件从哪一个字段开始出现了范围，索引就失效了

2. 联合索引在使用时遵循最左前缀原则（有a就能命中索引）

3. 联合索引中只有使用and能生效，使用or失效

MySQL收尾

执行计划

explain sql语句

查看sql语句的执行计划（是否命中索引，命中索引类型等）

覆盖索引

查的条件时索引列，并且显示的是查的条件相关的列

explain sql语句如果看见 using index 表示覆盖索引

索引合并

创建的时候分开创建，用的时候临时合并到一起了

explain sql语句如果看见 using union 表示索引合并

慢日志

MySQL日志管理
========================================================
错误日志: 记录 MySQL 服务器启动、关闭及运行错误等信息
二进制日志: 又称binlog日志，以二进制文件的方式记录数据库中除 SELECT 以外的操作
查询日志: 记录查询的信息
慢查询日志: 记录执行时间超过指定时间的操作
中继日志： 备库将主库的二进制日志复制到自己的中继日志中，从而在本地进行重放
通用日志： 审计哪个账号、在哪个时段、做了哪些事件
事务日志或称redo日志： 记录Innodb事务相关的如事务执行时间、检查点等
========================================================
一、bin-log
1. 启用
# vim /etc/my.cnf
[mysqld]
log-bin[=dir[filename]]
# service mysqld restart
2. 暂停
//仅当前会话
SET SQL_LOG_BIN=0;
SET SQL_LOG_BIN=1;
3. 查看
查看全部：
# mysqlbinlog mysql.000002
按时间：
# mysqlbinlog mysql.000002 --start-datetime="2012-12-05 10:02:56"
# mysqlbinlog mysql.000002 --stop-datetime="2012-12-05 11:02:54"
# mysqlbinlog mysql.000002 --start-datetime="2012-12-05 10:02:56" --stop-datetime="2012-12-05 11:02:54" 

按字节数：
# mysqlbinlog mysql.000002 --start-position=260
# mysqlbinlog mysql.000002 --stop-position=260
# mysqlbinlog mysql.000002 --start-position=260 --stop-position=930
4. 截断bin-log（产生新的bin-log文件）
a. 重启mysql服务器
b. # mysql -uroot -p123 -e 'flush logs'
5. 删除bin-log文件
# mysql -uroot -p123 -e 'reset master' 


二、查询日志
启用通用查询日志
# vim /etc/my.cnf
[mysqld]
log[=dir[filename]]
# service mysqld restart

三、慢查询日志
启用慢查询日志
# vim /etc/my.cnf
[mysqld]
log-slow-queries[=dir[filename]]
long_query_time=n
# service mysqld restart
MySQL 5.6:
slow-query-log=1
slow-query-log-file=slow.log
long_query_time=3  单位为秒
查看慢查询日志
测试:BENCHMARK(count,expr)
SELECT BENCHMARK(50000000,2*3);

日志管理

日志管理

慢日志通过配置文件开启

数据库/表的导入导出

备份表 :homwork库中的所有表和数据
    mysqldump -uroot -p123 work > D:day42a.sql
    备份单表
    mysqldump -uroot -p123 work course > D:day42a.sql

备份库 :
    mysqldump -uroot -p123 --databases work > D:day42db.sql

恢复数据:
    进入mysql 切换到要恢复数据的库下面
    sourse D:day42a.sql

sql语句

事务

开启事务，给数据加锁，防止数据被多个人同时修改

begin;
select id from t1 where name = 'alex' for update;
update t1 set id = 2 where name = 'alex';
commit;

sql语句

多表联查速度慢怎么办

1. 从表结构的角度

　　尽量用固定长度的数据类型代替可变长数据类型

　　把固定长度的字段放前面

2. 从数据的角度

　　表中的数据越多，查询速度就越慢

　　列多：垂直分表　　行多：水平分表

3. 从sql的角度

　　尽量把条件写的细致，where条件多做筛选

　　多表尽量用连表代替子查询

　　创建有效的索引，规避无效的索引

4. 从配置的角度

　　开启慢日志查询，确认具体的有问题的sql语句并修改

5. 从数据库的角度

　　读写分离（解决数据库读的瓶颈）