mysql数据库基础

1 内连接与外连接

　　内连接(inner join)与外连接的区别是内连接仅仅筛选匹配中的数据，而外连接会选出其他不匹配的数据。具体使用内链接还是外连接看业务和习惯吧。

2 子查询

　　当进行查询时候，需要的条件是另外一个select语句的结果，这时候需要用到子查询,关键字是 in , not in, = , !=, exists ,not exists等

　　如果子查询结果只有一条，也可以使用 = 代替in

　　有些情况，子查询可以转化为表连接，转表连接可以优化子查询。

3 　　union , union all

　　　　　作用都是合并结果集，union 是union all后的结果进行一次distinct 去除重复记录的结果。

4　　mysql数据类型

　　数值　　在定义数值字段时，会有一个宽度如int(5),这个宽度是配合zerofile使用的，意思是当数据宽度不足5的时候在数字前面使用0填充。

　　字符

　　　　char与varchar的区别，char 会删除尾部的空格而varchar不会，char是固定长度的字符类型，varchar是可变长的字符类型。

　　　　该如何选择字符串类型？对于常用的InnoDB引擎，建议使用varchar，对于InnoDB 数据表内部存储格式没有区分固定长度和可变长度列(所有数据行都使用指向数据列值的头指针)，因此本质上使用固定长度的char 不一定比可变长度的varchar性能要好，主要性

　　　　能因素还是数据行的存储总量。

　　TEXT 与BLOB

　　　　这两种主要用于存储大文本的，区别是 TEXT 只能保存字符数据如文章或者日记，BLOB 用来存二进制数据如照片视频等等。这两种类型会造成一定的性能问题

5　　mysql各种运算的优先级，实际工作中可以直接使用(),将需要优先的操作括起来

6　　mysql函数

　　常用函数有字符串函数，数值函数，日期和时间函数，流程函数等等。下面看看流程函数语法

7　两种主要存储引擎的比较

　　InnoDB　　支持事务，效率比MyISAM低一些，锁等级是行锁。

　　MyISAM 　不支持事务，效率比较高，锁等级锁表锁。

8　浮点数(float,double)与定点数(decimal)

　　对于浮点数当插入数据的精度超过定义的实际精度，会自动被四舍五入然后插入数据库

　　对于定点数定点数实际是一字符串的形式存放的，所以可以精确的存放数据

　　使用浮点数可能出现误差，上面可以看出来，所以尽量使用decimal

9　　sql优化

　　1 定位执行效率低的sql语句，使用--log-slow-queries[=file_name]选项启动时，mysql会写入一个所有包含执行时间超过long_query_time秒的日志文件。

　　2 使用以上步骤查询到效率低的sql语句之后，通过explain或者desc命令获取mysql的执行计划，执行计划包括执行过程中表如何连接和连接的顺序等等信息。

　　输出字段解释

　　select_type　　查询类型 SAMPLE(简单表，即不使用表连接或者子查询)， PRIMARY(主查询，即外层查询),UNION(UNION中的第二个，或者后面的子查询),SUBQUERY(子查询中的第一个select)

　　table 　　输出结果集的表

　　type 访问类型性能从差到好依次是 ALL < index < range < ref < eq_ref < const,system < NULL 　

　　　　ALL 全表扫描(mysql遍历全表来查找匹配行)，index （mysql遍历整个索引来查询匹配行），range（索引范围查找，常见于 < <= > >= between等）,ref (使用非唯一索引扫描或唯一索引的前缀扫描返回某个单独值的记录行)，eq_ref （类似于 ref，区别：百度），const,system （单表中最多有一个结果行速度很快，如根据主键或者unique key 来查询），NULL （不扫描表或者索引就得到结果，如select 1 from test）

　　possible_keys 可能使用到的索引

　　key 实际使用的索引

　　key_len　　　　使用到的索引字段的长度

　　rows 　　　　扫描行的数量

　　Extra 　　　　执行计划的说明

　　3 通过show profile来分析sql 这个有点复杂呀我日，参考https://blog.csdn.net/taojin12/article/details/81349112

　　4 通过trace分析优化器分析mysql执行器的行为这个也有点难参考https://blog.csdn.net/taojin12/article/details/81489234　　

　　5 索引主要使用的索引就是BTREE索引其他索引不讨论

　　mysql中使用索引的典型场景

　　　　1 匹配最左前缀，最左前缀原则可以说是mysql中B-TREE索引使用的首要原则。

　　　　假设一个联合索引包含三列(col1 ,clo2 clo3), 那么可以使用 col1,(col1 + col2),(clo1 +col2 +clo3),(col1 + col3)查询利用到，对于(col2) ,(col2,col3)则不会用到

　　　　2 全值匹配：和索引中的所有列进行匹配

　　　　3 匹配值的范围查询，多索引的值进行范围查找如cusomer_id > 11 and customer_id < 100

　　　　4 进对索引列进行查询，当需要查询的列都在索引的字段时查询效率更高, 下面的Extra部分变成了 Using index ,意味着直接访问索引就足够取数据了不需要通过索引再去表查询

　　　　5 匹配列前缀仅仅使用索引的第一列并且只包含第一列的开头一部分进行查找。User where 表示需要通过索引回表查询数据。

　　存在索引但是不能使用索引的主要典型场景

　　　　1 以%开头的like查询不会使用索引 (这个可以使用全文索引来解决类似全文检索问题)

　　　　2 数据类型出现了隐式转换的时候不会使用索引，

　　　　3 联合索引的情况下，假设查询条件不包含索引的最左列部分(不满足最左前缀原则)，不会使用符合索引。

　　　　4 用or 分开的条件如果or前的条件列有索引而后面的列无索引，那么涉及到的索引都不会被用到

　　　　常见的sql优化

　　　　1 批量的insert操作,这样可以减少客户端与数据库之间的连接，关闭等消耗，比多个单insert 插入快很多，当然也需要结合jdbc的批处理技术一起使用。

　　　　2 优化order by

　　　　　　数据脚本文件是 http://downloads.mysql.com/docs/sakila-db.zip

　　　　　　mysql 有两种排序方式，第一种是通过有序索引顺序扫描直接返回有序数据，这种操作效率很高

　　　　　　第二种是对返回的数据进行排序，这也叫Filesort排序，所有不是通过索引直接返回排序结果的排序都叫Filesort排序,排序操作有可能是使用磁盘文件也可能是临时表具体取决于mysql服务器的排序参数。

　　　　　　　　根据以上的两种方式描述，我们的优化目标是尽量减少额外的排序，通过索引返回有序的数据，where 和order by使用相同的索引并且order by的顺序和索引的顺序相同，并且尽量都是升序或者降序否是会出现filesort。

　　　　3 优化group by

　　　　　　默认情况下，mysql对所有 group by col1 ,clo2 ...的字段排序，这与查询中指定order by clo1，col2...相似。因此如果显式包含一个相同order by 子句，则对执行性能无影响。

　　　　　　第一个使用filesort ，第二个不使用filesort，使用filesort的时候往往是比较消耗时间的。

　　　　　　4 优化嵌套查询

　　　　　　　　mysql4 .1开始支持子查询，子查询可以一次性的完成很多逻辑上需要多个步骤的sql操作，同时也可以避免事务或者表锁死，但是有些情况下可以使用表连接查询来替代子查询。连接查询之所以比子查询效率高，是因为mysql无需在内存中建立临时表来完成逻辑上需要两个步骤的查询。

　　　　　　可以看到index_subquery 调整为了ref。效率更好一点。

　　　　　　5 优化OR条件查询

　　　　　　如果要利用索引，那么 or之间的条件都必须用到索引才行，如果没索引可以考虑加索引。

　　　　　　6 优化分页查询　　limit比较头疼，比如 limit 1000,20 mysql 需要排序出前1020条记录，然后仅仅需要返回1001条到1020条记录，前面1000条记录都会被抛弃，随着数据量越来越大所消耗的时间会越来越长，查询和排序的代价都非常高。

　　　　　　第一种优化思路，增加上一页的最后一行主键id值，比如 15640 ,

　　　　　　可以看的出来，这种方法不是一个很完美的解决方法，它要求主键有序，对于非主键有序(比如uuid)的场景不适用。另外这个这个查询结果依赖于上一页的结果那假设用户想从第2页跳到第100页呢？谁来提供第99页的最后一行主键id值？

　　　　　　第二种思路，使用主键来做这个地方先去网上搜一下吧

10 优化表结构

　　主要冷热数据分离，数据适当冗余以及使用中间表

11 mysql 锁

　　表锁:表锁有两种模式：共享读锁，独占写锁。mysql 在执行select前会自动给表加读锁，在执行 uddate delete insert之前会自动给表加写锁。

　　　　共享读锁不会阻塞其他用户的读请求，但是会阻塞对同一个表的写请求。

　　　　独占写锁即会阻塞其他用户的读请求，也会阻塞写请求。

　　InnoDB 锁