mysql的性能优化简介

mysql性能下降的原因

sql语句本身有问题，或没建索引
索引失效，索引失效的原因本文后面会叙述
关联了过多的表，可能是前期设计缺陷，或者太奇葩的需求
服务器调优及参数设置，例如缓冲、线程等

mysql多表连接查询的模式

1. 左表和右表的共有部分，即内连接

SELECT fileds

FROM TableA AS A

INNER JOIN TableB AS B

ON A.key1 = B.key2;

2. 左表和右表的共有部分+左表的全部，即左连接

SELECT fileds

FROM TableA AS A

LEFT JOIN TableB AS B

ON A.key1 = B.key2;

3. 左表和右表的共有部分+右表的全部，即右连接

SELECT fileds

FROM TableA AS A

RIGHT JOIN TableB AS B

ON A.key1 = B.key2;

4. 左表独有的部分

SELECT fileds

FROM TableA AS A

LEFT JOIN TableB AS B

ON A.key1 = B.key2

WHERE B.key2 IS NULL;

5. 右表独有的部分

SELECT fields

FROM TableA AS A

RIGHT JOIN TableB AS B

ON A.key1 = B.key2

WHERE A.key1 IS NULL;

6. 左表的全部+右表的全部

mysql不支持full outer join，只能用union来实现

SELECT fields

FROM TableA AS A

LEFT JOIN TableB AS B

ON A.key1 = B.key2

UNION

SELECT fields

FROM TableA AS A

RIGHT JOIN TableB AS B

ON A.key1 = B.key2;

7. 左表独有的部分+右表独有的部分，即内连接的补集

SELECT fields

FROM TableA AS A

LEFT JOIN TableB AS B

ON A.key1 = B.key2

WHERE B.key2 IS NULL

UNION

SELECT fields

FROM TableA AS A

RIGHT JOIN TableB AS B

ON A.key1 = B.key2

WHERE A.key1 IS NULL;

索引

1. 索引的概念

官方定义：索引是帮助mysql高效获取数据的数据结构。划重点：数据结构。在数据之外，数据库系统还维护了一套满足特定查找算法的数据结构，这些数据结构以某种方式指向数据，这种数据结构就是索引，可以简单的理解为"排好序的快速查找数据结构"。索引本身也很大，不可能全部存储在内存，通常以索引文件的形式存储在磁盘中。

2. 索引按结构分类及其检索原理

BTree索引
Hash索引
full-text全文索引
R-Tree索引

一般Java开发工程师用到的是BTree索引，或者称为B树索引，其检索原理如下图所示

如果要查找数字93，在第一层判断93<100，因此找左边的指针；在第二层判断93>80，因此找右边的指针；在第三层的磁盘块中找到了存储的93。B树索引的纵向层次决定了一次检索需要几次IO，因此纵向层次越少，性能越优。一般三层B树可以处理100万数据，如果不使用索引，可能需要几万到几十万次IO，但使用索引只需要3次。

3. 索引按字段分类

单值索引：索引只包含1个列，一个表可以建多个单值索引
复合索引：索引包含多个列
唯一索引：索引列的值必须是唯一的，但允许有空值

4. 新建索引

CREATE [UNIQUE] INDEX indexName ON tableName(columnName);

ALTER TABLE tableName ADD [UNIQUE] INDEX indexName (columnName);

以上两个语句都可以用于新建索引。其中，indexName是索引名称，tableName是表名，columnName是列名，如果是多列索引中间用逗号分隔，如果新建的是唯一索引，需要加UNIQUE。

5. 删除索引

DROP INDEX indexName ON tableName;

其中，indexName是索引名称，tableName是表名，表示删除指定表的指定索引。

6. 查看索引

SHOW INDEX FROM tableNameG

其中，tableName是表名，G是为了显示格式优化。

7. 索引的优势

提高数据检索效率，降低数据库的IO成本
通过索引对数据进行排序，降低CPU消耗

因此，索引有两个功能，分别作用在WHERE字句和ORDER BY子句上。

8. 索引可能引起的问题

索引也是一张表，保存了主键和索引字段，并指向实体表的记录
索引提高了读表速度，却降低了写表的速度，因为在进行INSER、DELETE、UPDATE操作时，不仅要保存数据，还要保存因更新表带来的索引信息变化

索引并不是随便加，也不是越多越好，过多的或者不恰当的索引，反而会降低数据库的效率，一般一个表不应超过5个索引。

9. 适合建索引的情况

主键自动建立唯一索引
连表查询时，对外连接的字段
频繁用作查询条件的字段，即WHERE filedName = 'xxx'
需要排序的字段，即ORDER BY fieldName

10. 不适合建索引的情况

频繁更新的字段，因为每次更新都需要更新索引信息
WHERE子句里极少用到的字段
表记录数量太少，一般低于百万数据的表，建索引意义不大，超过300万性能才开始下降
数据大量重复且平均分布的字段，建索引意义不大，例如一个字段表示性别，值不是男就是女，且出现的概率差不多，就没有必要建索引。

关于最后一条，涉及一个概念：索引的选择性。索引的选择性是指一个字段的不同的值的数量跟表的记录数的比值，例如一个字段可能存在8888个值，这个表共有10000条记录，那么在这个字段上建的索引的选择性就是0.8888。索引选择性越接近1，它的效率就越高。上面提到的"性别"字段，可能存在的值只有2个，如果这个表有10000条记录，那么如果在这个字段上建索引，它的选择性只有0.0002。