高性能mysql 4 ，5章

第4章

1：查询优化，多表连接时只取需要的列，要对select * 保持怀疑。

2：如果发现访问的数据行数很大，而生成的结果中数据行很少，那么可以尝试更复杂的修改

a: 使用覆盖索引，b: 更改架构，一个例子就是使用汇总表，c: 重写复杂的查询，让mysql的优化器可以以优化的方式执行它。

3：重构查询的方式，a: 将复杂查询修改为多个简单查询，b: 缩短查询，使用分治算法，每次查询，删除一部分。c:分解联接，可以把一个多表联接分解成多个单个查询，然后在应用程序端，实现联接操作。

单个查询使用缓存效率更高，应用程序端进行连接可以更方便的扩展数据库，把不同的表放在不同的服务器上面。

4：什么时候再应用程序端进行联接效率更高

a: 可以缓存早期查询的大量数据，b:使用了多个MyISAM表（单个查询锁住表的时间更短），c: 数据分布在不同的服务器上，d: 对于大表使用in()替换联接 e:一个联接引用了同一个表很多次

5：查询状态，每个mysql连接都有装态，可以用show full processlist;来查询，在Command列。

mysql> show full processlist;
+----+------+-----------------+------+---------+------+-------+-----------------------+
| Id | User | Host            | db   | Command | Time | State | Info                  |
+----+------+-----------------+------+---------+------+-------+-----------------------+
|  7 | root | localhost:51849 | NULL | Sleep   |   44 |       | NULL                  |
|  8 | root | localhost:51855 | test | Sleep   |   21 |       | NULL                  |
|  9 | root | localhost:51857 | test | Query   |    0 | NULL  | show full processlist |
+----+------+-----------------+------+---------+------+-------+-----------------------+
3 rows in set

6：选择无缓存的查询

select sql_no_cache count(*) from salarie;

7:优化过程

a: 对联接中的表重新排序 b:将外联接转换成内联接 c: 代数等价法则：例如 a=5 and a>5会被精简成 a>5

d: 优化min,max,count ： min索引B+树的左边就行了，max查找索引的最右边就行了。如果where后面没有条件，MyISAM总是保留行数的精确值

e: 计算和减少常量表达式：例如min函数可以被简化成为一个常量。 f:覆盖索引：当索引包含查询需要的所有列时，可以使用覆盖索引。

g:子查询优化：mysql可以将某些类型的子查询转换成相等的效率更高的形式，把它们简化为索引查找，而不是独立的多个查询。有子查询时，先子查询再外查询。

h: 早期终结 i:相等传递 j: 比较in()里面的数据 k: 表和索引统计 l: mysql的联接执行策略

8： mysql查询优化器的限制

a: 关联子查询：会出现意想不到的优化结果。有可能慢，有可能快，要根据实际测试结果。 b: 联合的限制 c:索引合并优化 d:......

9： limit 和 offset的优化，有时候可以将limit转换为位置性查询，例如 p between 50 and 54 order by postion;

mysql> select * from salarie limit 4 offset 9;
+--------+--------+----+
| name   | salary | id |
+--------+--------+----+
| wangwu |    200 | 10 |
| wangwu |    200 | 11 |
| wangwu |    200 | 12 |
| wangwu |    200 | 13 |
+--------+--------+----+
4 rows in set

10: 查询优化提示：

a：straight_join 可以用于联接语句。

select straight_join * from salarie;

b: high_priority 指定查询语句的优先级

select high_priority * from salarie;

c: delayed ，INSERT DELAYED仅适用于MyISAM, MEMORY和ARCHIVE表。延迟插入。

insert into delayed salarie(name,salary) values('gaodan',4000);

11: INTERVAL 指定时间区间，http://www.w3school.com.cn/sql/func_date_add.asp

12：用户自定义变量

set @var1:=0;

第5章 mysql高级特性

1：缓存就是一个查找表。

2：缓存不会存储有不确定结果的查询，例如now(),current_date();

3: 当事务内部的语句更改了表，即使innodb的多版本机制应当对其他语句隐藏事务的变化，服务器也会使所有引用了该表的查询缓存失效，直到事务提交之前，该表会全局的不可缓存。

4：缓存未命中：缓存未命中的原因可能有以下几个原因，a: 查询不可缓存：原因可能是含有不可确定函数，比如current_date,也有可能是缓存结果太大无法缓存。

状态变量Qchache_not_cached会因为这两种无法缓存的查询而增加。

b:服务器以前没有见过这个缓存，所以它根本就没有机会缓存自身结果。

c:查询的缓存以前被缓存过，但是服务器把它移除了，发生移除的原因可能是内存空间不够，所以被人从服务器把它溢出了，也可能缓存失效了。

如果服务器很多缓存未命中，但是不能缓存的查询却很少，那么原因应该是下面之一：

a:查询缓存未被激活，也就是说服务器根本没有机会将结果存储到缓存中

b: 服务器看到了以前从未见过的缓存，如果没有很多重复的查询，即使缓存被激活了，也有可能见到这种情况。

c:很多缓存失效。

5：如果服务器实际使用的缓存数量小于分配的内存，那么应该把分配给它的内存减少一点，如果由于内存限制引起了缓存失效，那么就应该多分配一些内存。

6：对查询缓存进行维护与调优，可以通过以下选项设置

Query_cache_type=OFF/ON/DEMAND 表示缓存是否被激活
Query_cache_size 分配给查询的总内存，以字节为单位，必须是1024的整数倍。
Query_cache_min_res_unit 分配给缓存块的最小值
Query_cache_limit 这个选项限制了mysql存储的最大结果
Query_cache_wlock_invalidate 这个选项指是否缓存其他联接已经锁定的表。

7：在查询中添加 SQL_CACHE 和SQL_NO_CACHE可以决定该查询是否使用缓存。

8：过程，函数

存储过程

delimiter //
drop procedure if exists p1;//
create procedure p1(in i int)
    begin
    declare ii int default 0;
    set ii=i;
        while i<10 do
            insert into salarie(name,salary) values('shunzi',1000);
            set ii=ii+1;
        end while;
    end;//
    delimiter;

触发器，同一张表上不能创建两个触发器，同时创建两个触发器，会提示一下错误。

1235 - This version of MySQL doesn't yet support 'multiple triggers with the same action time and event for one table'

mysql> delimiter //
drop trigger if exists t1; //
create trigger t1 before insert on t
for each row
begin
    if(new.id>10000) then
        set new.id=10000;
    end if;
end;//
delimiter;
Query OK, 0 rows affected

Query OK, 0 rows affected

mysql> insert into t values(10005);
Query OK, 1 row affected

mysql> select * from t;
+-------+
| id    |
+-------+
| 10000 |
+-------+
1 row in set

事件：事件类似于定时任务，会在特定时间执行一次预先设定好的sql代码。时间和线程无关，它云星于一个独立的定时器线程上。

事件的执行：https://blog.csdn.net/lixia755324/article/details/53923856 https://blog.csdn.net/u013421629/article/details/72846742

例如定义一个事件，每周调用一下存储过程p1

create event e1 on schedule every 1 week
do
call p1(10);

查看information_schema_events 表可以了解事件的状态

创建一个事件e2, 每两周优化一次表somedb

create event t2 on schedule every 2 week
do 
begin
    declare continue handler for sqlexception
        begin end;
    if get_lock('somedb',0) then   -- 加锁
        do call optimize_tables('somedb');
    end if;
    do release_lock('somedb');
        
end

事件：自定义事件liyafei

delimiter //
drop event if exists e3;//
create event e3 on schedule every 1 second on completion preserve
do
begin
    insert into t values(3);
end;//
delimiter;

alter event e3 enable;

9：注释：可以使用/**/给代码加注释，使用!9990给该注释一个版本号，例如下面在触发器中加注释。

//触发器
delimiter //
drop trigger if exists t1; //
create trigger t1 before insert on t
for each row
begin
/* !9999
hello;
*/
    if(new.id>10000) then
        set new.id=10000;
    end if;
end;//
delimiter;

10：函数处理当not found时，将a设置为0

declare continue/exit HANDLER FOR NOT FOUND set a=0;

11：游标 https://www.cnblogs.com/liyafei/p/9443464.html

12：准备语句

使用增强的二进制客户端/服务器协议在客户端和服务器之间高效的发送数据。创建准备语句时，客户端库会向服务器发送一个实际查询的原型，然后服务器对该原型进行解析和处理，将部分优化过的原型保存起来，并且给客户端返回一个状态句柄。客户端可以通过定义状态句柄重复地进行查询。

准备语句的优点：
a:服务器只需要解析一次查询，这节约了解析和其他的开销
b: 因为服务器缓存了一部分执行计划，所以它只需要执行某些优化步骤一次。
c: 通过二进制发送参数比通过ascll码要快的多
d: 整个查询不会被发送到服务器，只有参数才会被发送，这减少了网络流量
e: mysql 直接把参数保存在服务器的缓冲区内，不需要在内存中到处拷贝。
准备查询语句不需要在应用程序中对值进行转义和加引号，防止了攻击。

-- 准备语句可以有参数，

insert into salarie(id,name,salary) values(?,?,?);

-- 准备语句的SQL语言接口

mysql> set @sql:='select id,salary,name from salarie where id=?';
prepare pre_stmt_fetch from @sql;   --  提取出准备语句
set @actor_name:='20';             -- 参数值
execute pre_stmt_fetch using @actor_name; -- 执行 
Query OK, 0 rows affected

Query OK, 0 rows affected
Statement prepared

Query OK, 0 rows affected

+----+--------+----------+
| id | salary | name     |
+----+--------+----------+
| 20 |    400 | zhangsan |
+----+--------+----------+
1 row in set

-- 删除准备语句

mysql> deallocate prepare pre_stmt_fetch;
Query OK, 0 rows affected

准备语句主要用于存储过程，可以在存储过程内部执行动态sql。
例如：下面是一个可以在特定的数据库中针对每一个表都调用OPTIMIZE TABLE;

drop procedure if exists oprimize_tables;
DELIMITER //
create procedure oprimize_tables(db_name varchar(64))
    BEGIN
        declare t varchar(64);
        declare done int default 0;
        declare c cursor for 
            select table_name from information_schema_.tables where table_schema=db_name and table_type='base table';
        declare continue handler for sqlstate '02000' set done=1;
        open c;
        tables_loop:LOOP
            fetch c into t;
            if done then
                close c;
                leave tables_loop;
            end if;
            set @stmt_text:=concat("OPTIMIZE TABLE",db_name,".",t);
            prepare stmt from @stmt_text;
            execute stmt;
            deallocate prepare stmt;
        end LOOP;
        close c;
    END//
DELIMITER;

13：视图

可更新视图：可更新视图应该满足下列所有条件

a: from字句中只有一个数据库关系

b: select 字句中只包含关系的属性名，不包含任何表达式，聚集或distinct声明。

c: 任何没有出现在select字句中的属性可以取空值；即这些属性行没有 not null约束，也不构成主码的一部分

d: 查询中不含有group by 或having字句。

14:视图的性能影响：

a:可以改善性能，例如，利用视图重构数据库架构的某一阶段，可以在更改它访问的表的同时，使代码继续工作。

b: 可以使用视图实现列权限，但是却没有实际创建这些权限的开销

create view v1 as select salary,name from salarie;
grant select on v1.* to user1;

视图的局限：

a:mysql不支持物化视图，物化视图通常把结果存储在一个不可见的表里面，然后周期性的从原始数据对不可见的表进行刷新。

b: mysql 也不支持索引视图，可以通过创建缓存表和汇总表模拟物化视图和索引视图。

15：字符集和排序规则 https://www.cnblogs.com/wcwen1990/p/6917109.html

a:为什么不都用utf-8, 因为utf-8 占用的字节比较大。

16：全文搜索

a: myisam全文索引是一种特殊的具有两层结构的B树，第一层保存了关键字，然后对每个关键字，第二层包含了一个列表，它有相关的文档指针组成，这些指针包含该关键字的全文集合。

b:查询索引

mysql> show index from salarie;
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table   | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| salarie |          0 | id       |            1 | id          | A         |          27 | NULL     | NULL   |      | BTREE      |         |               |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
1 row in set

17：合并表和分区表

合并表：

drop table t1;
drop table t2;
drop table mrg;
create table t1(a int)engine=MyISAM;
create table t2(a int)engine=MyISAM;
insert into t1 values(1),(2);
insert into t2 values(1),(2);
create table mrg(a int) engine=merge union(t1,t2) insert_method=last;
select * from mrg;

报错

1168 - Unable to open underlying table which is differently defined or of non-MyISAM type or doesn't exist

是因为merge默认引擎没写：修改如下

create table mrg(a int) engine=merge union(t1,t2) insert_method=last default charset=utf8;

结果：

mysql> drop table t1;
drop table t2;
drop table mrg;
create table t1(a int)engine=MyISAM;
create table t2(a int)engine=MyISAM;
insert into t1 values(1),(2);
insert into t2 values(1),(2);
create table mrg(a int) engine=merge union(t1,t2) insert_method=last default charset=utf8;
select * from mrg;

Query OK, 0 rows affected

+---+
| a |
+---+
| 1 |
| 2 |
| 1 |
| 2 |
+---+
4 rows in set

在合并表中插入，能够在指标中查询到

mysql> insert into mrg values(3);
Query OK, 1 row affected

mysql> select * from t2;
+---+
| a |
+---+
| 1 |
| 2 |
| 3 |
+---+
3 rows in set

分区表：

分区表，可以按照日期分区，如果一个表很大，例如每天插入10000000条记录，时间长了，表中数据原来越大，使用主键全表扫面，性能较低。

于是，可以按日期对表进行分区，每次查询访问某个时间段即可。

但是不要同时加上主键和对表进行分区，这有可能降低性能。尤其是要对所有分区进行扫描的时候，在考虑分区时，要仔细地做性能评测，因为分区表并不总是能提高性能。

分区表使用和示例：

创建一个表，对其分区

create table sales_by_day(
    day date not null,
    product int not null,
    sales decimal(10,2) not null,
    returns decimal(10,2) not null,
    primary key(day,product)
)engine=innodb;


alter tables sales_by_day partition by range(year(day))(
    partition p_2006 values less than (2007),
    partition p_2007 values less than (2008),
    partition p_2008 values less than (2009),
    partition p_catchall values less than maxvalue);
    
insert into sales_by_day(day,product,sales,returns) values
('2007-01-15',19,50.00,52.00),
('2008-01-15',11,41.00,42.00);

分区表一个常用的用途就是分布大表中的行。

alter table very_big_table partition by key(<primary key columns>)(
partition p0 data direcotry='/data/mydb/big_table_p0',
partition p1 data direcotry='/data/mydb/big_table_p1'
);