高性能mysql 4 ,5章

第4章

1:查询优化,多表连接时只取需要的列,要对select * 保持怀疑。

2:如果发现访问的数据行数很大,而生成的结果中数据行很少,那么可以尝试更复杂的修改

     a: 使用覆盖索引,b: 更改架构,一个例子就是使用汇总表 ,c: 重写复杂的查询,让mysql的优化器可以以优化的方式执行它。

3:重构查询的方式,a: 将复杂查询修改为多个简单查询,b:  缩短查询,使用分治算法,每次查询,删除一部分。c:分解联接,可以把一个多表联接分解成多个单个查询,然后在应用程序端,实现联接操作。

单个查询使用缓存效率更高,应用程序端进行连接可以更方便的扩展数据库,把不同的表放在不同的服务器上面。

4:什么时候再应用程序端进行联接效率更高

a: 可以缓存早期查询的大量数据,b:使用了多个MyISAM表(单个查询锁住表的时间更短),c: 数据分布在不同的服务器上,d: 对于大表使用in()替换联接  e:一个联接引用了同一个表很多次

5:查询状态,每个mysql连接都有装态,可以用show full processlist;来查询,在Command列。

mysql> show full processlist;
+----+------+-----------------+------+---------+------+-------+-----------------------+
| Id | User | Host            | db   | Command | Time | State | Info                  |
+----+------+-----------------+------+---------+------+-------+-----------------------+
|  7 | root | localhost:51849 | NULL | Sleep   |   44 |       | NULL                  |
|  8 | root | localhost:51855 | test | Sleep   |   21 |       | NULL                  |
|  9 | root | localhost:51857 | test | Query   |    0 | NULL  | show full processlist |
+----+------+-----------------+------+---------+------+-------+-----------------------+
3 rows in set

 6: 选择无缓存的查询

select sql_no_cache count(*) from salarie;

 7:优化过程

    a: 对联接中的表重新排序  b:将外联接转换成内联接    c: 代数等价法则 : 例如  a=5 and a>5会被精简成 a>5

    d:  优化min,max,count :  min索引B+树的左边就行了,max查找索引的最右边就行了。  如果where后面没有条件,MyISAM总是保留行数的精确值

     e: 计算和减少常量表达式:例如min函数可以被简化成为一个常量。    f:覆盖索引:当索引包含查询需要的所有列时,可以使用覆盖索引。

g:子查询优化:mysql可以将某些类型的子查询转换成相等的效率更高的形式,把它们简化为索引查找,而不是独立的多个查询。     有子查询时, 先子查询再外查询。

h: 早期终结  i:相等传递    j: 比较in()里面的数据   k: 表和索引统计   l:  mysql的联接执行策略    

8: mysql查询优化器的限制

   a: 关联子查询:会出现意想不到的优化结果。有可能慢,有可能快,要根据实际测试结果。  b: 联合的限制   c:索引合并优化  d:......

9: limit 和  offset的优化,  有时候可以将limit转换为位置性查询,例如  p between 50 and 54 order by postion;

mysql> select * from salarie limit 4 offset 9;
+--------+--------+----+
| name   | salary | id |
+--------+--------+----+
| wangwu |    200 | 10 |
| wangwu |    200 | 11 |
| wangwu |    200 | 12 |
| wangwu |    200 | 13 |
+--------+--------+----+
4 rows in set

10:   查询优化提示:

a:straight_join  可以用于联接语句。

select straight_join * from salarie;

b: high_priority 指定查询语句的优先级

select high_priority * from salarie;

c: delayed ,INSERT DELAYED仅适用于MyISAM, MEMORY和ARCHIVE表。延迟插入。

insert into delayed salarie(name,salary) values('gaodan',4000);

 11:  INTERVAL  指定时间区间,http://www.w3school.com.cn/sql/func_date_add.asp

   12: 用户自定义变量

set @var1:=0;

第5章  mysql高级特性

1:缓存就是一个查找表。

2:缓存不会存储有不确定结果的查询,例如now(),current_date();

3: 当事务内部的语句更改了表,即使innodb的多版本机制应当对其他语句隐藏事务的变化,服务器也会使所有引用了该表的查询缓存失效,直到事务提交之前,该表会全局的不可缓存。

 4:缓存未命中:缓存未命中的原因可能有以下几个原因,a: 查询不可缓存:原因可能是含有不可确定函数,比如current_date,也有可能是缓存结果太大无法缓存。

状态变量Qchache_not_cached会因为这两种无法缓存的查询而增加。

b:服务器以前没有见过这个缓存,所以它根本就没有机会缓存自身结果。

c:查询的缓存以前被缓存过,但是服务器把它移除了,发生移除的原因可能是内存空间不够,所以被人从服务器把它溢出了,也可能缓存失效了。

如果服务器很多缓存未命中,但是不能缓存的查询却很少,那么原因应该是下面之一:

a:查询缓存未被激活,也就是说服务器根本没有机会将结果存储到缓存中

b: 服务器看到了以前从未见过的缓存,如果没有很多重复的查询,即使缓存被激活了,也有可能见到这种情况。

c:很多缓存失效。

 5:如果服务器实际使用的缓存数量小于分配的内存,那么应该把分配给它的内存减少一点,如果由于内存限制引起了缓存失效,那么就应该多分配一些内存。

 6:对查询缓存进行维护与调优,可以通过以下选项设置

Query_cache_type=OFF/ON/DEMAND 表示缓存是否被激活
Query_cache_size 分配给查询的总内存,以字节为单位,必须是1024的整数倍。
Query_cache_min_res_unit 分配给缓存块的最小值
Query_cache_limit 这个选项限制了mysql存储的最大结果
Query_cache_wlock_invalidate 这个选项指是否缓存其他联接已经锁定的表。

7:在查询中添加 SQL_CACHE 和SQL_NO_CACHE可以决定该查询是否使用缓存。  

8:过程,函数

存储过程

delimiter //
drop procedure if exists p1;//
create procedure p1(in i int)
    begin
    declare ii int default 0;
    set ii=i;
        while i<10 do
            insert into salarie(name,salary) values('shunzi',1000);
            set ii=ii+1;
        end while;
    end;//
    delimiter;

 触发器,同一张表上不能创建两个触发器 ,同时创建两个触发器,会提示一下错误。

1235 - This version of MySQL doesn't yet support 'multiple triggers with the same action time and event for one table'
mysql> delimiter //
drop trigger if exists t1; //
create trigger t1 before insert on t
for each row
begin
    if(new.id>10000) then
        set new.id=10000;
    end if;
end;//
delimiter;
Query OK, 0 rows affected

Query OK, 0 rows affected

mysql> insert into t values(10005);
Query OK, 1 row affected

mysql> select * from t;
+-------+
| id    |
+-------+
| 10000 |
+-------+
1 row in set

 事件:事件类似于定时任务,会在特定时间执行一次预先设定好的sql代码。时间和线程无关,它云星于一个独立的定时器线程上。

事件的执行:https://blog.csdn.net/lixia755324/article/details/53923856   https://blog.csdn.net/u013421629/article/details/72846742

 例如定义一个事件,每周调用一下存储过程p1

create event e1 on schedule every 1 week
do
call p1(10);

查看information_schema_events 表可以了解事件的状态

创建一个事件e2,  每两周优化一次 表somedb

create event t2 on schedule every 2 week
do 
begin
    declare continue handler for sqlexception
        begin end;
    if get_lock('somedb',0) then   -- 加锁
        do call optimize_tables('somedb');
    end if;
    do release_lock('somedb');
        
end

事件:自定义事件liyafei

delimiter //
drop event if exists e3;//
create event e3 on schedule every 1 second on completion preserve
do
begin
    insert into t values(3);
end;//
delimiter;

alter event e3 enable;

9:注释:可以使用/**/给代码加注释,使用!9990给该注释一个版本号,例如下面在触发器中加注释。

//触发器
delimiter //
drop trigger if exists t1; //
create trigger t1 before insert on t
for each row
begin
/* !9999
hello;
*/
    if(new.id>10000) then
        set new.id=10000;
    end if;
end;//
delimiter;

 10:  函数处理  当not found时,将a设置为0

declare continue/exit HANDLER FOR NOT FOUND set a=0;

 11:游标 https://www.cnblogs.com/liyafei/p/9443464.html

12:准备语句

使用增强的二进制客户端/服务器协议在客户端和服务器之间高效的发送数据。创建准备语句时,客户端库会向服务器发送一个实际查询的原型,然后服务器对该原型进行解析和处理,将部分优化过的原型保存起来,并且给客户端返回一个状态句柄。客户端可以通过定义状态句柄重复地进行查询。

准备语句的优点:
a:服务器只需要解析一次查询,这节约了解析和其他的开销
b: 因为服务器缓存了一部分执行计划,所以它只需要执行某些优化步骤一次。
c: 通过二进制发送参数比通过ascll码要快的多
d: 整个查询不会被发送到服务器,只有参数才会被发送,这减少了网络流量
e: mysql 直接把参数保存在服务器的缓冲区内,不需要在内存中到处拷贝。
准备查询语句不需要在应用程序中对值进行转义和加引号,防止了攻击。

-- 准备语句可以有参数,

insert into salarie(id,name,salary) values(?,?,?);

 -- 准备语句的SQL语言接口

mysql> set @sql:='select id,salary,name from salarie where id=?';
prepare pre_stmt_fetch from @sql;   --  提取出准备语句
set @actor_name:='20';             -- 参数值
execute pre_stmt_fetch using @actor_name; -- 执行 
Query OK, 0 rows affected

Query OK, 0 rows affected
Statement prepared

Query OK, 0 rows affected

+----+--------+----------+
| id | salary | name     |
+----+--------+----------+
| 20 |    400 | zhangsan |
+----+--------+----------+
1 row in set

 -- 删除准备语句

mysql> deallocate prepare pre_stmt_fetch;
Query OK, 0 rows affected
准备语句主要用于存储过程,可以在存储过程内部执行动态sql。
例如:下面是一个可以在特定的数据库中针对每一个表都调用OPTIMIZE TABLE;
drop procedure if exists oprimize_tables;
DELIMITER //
create procedure oprimize_tables(db_name varchar(64))
    BEGIN
        declare t varchar(64);
        declare done int default 0;
        declare c cursor for 
            select table_name from information_schema_.tables where table_schema=db_name and table_type='base table';
        declare continue handler for sqlstate '02000' set done=1;
        open c;
        tables_loop:LOOP
            fetch c into t;
            if done then
                close c;
                leave tables_loop;
            end if;
            set @stmt_text:=concat("OPTIMIZE TABLE",db_name,".",t);
            prepare stmt from @stmt_text;
            execute stmt;
            deallocate prepare stmt;
        end LOOP;
        close c;
    END//
DELIMITER;

 13:视图

    可更新视图:可更新视图应该满足下列所有条件

a: from字句中只有一个数据库关系

b: select 字句中只包含关系的属性名,不包含任何表达式,聚集或distinct声明。

c: 任何没有出现在select字句中的属性可以取空值;即这些属性行没有 not null约束,也不构成主码的一部分

d: 查询中不含有group by 或having字句。

14:视图的性能影响:

a:可以改善性能,例如,利用视图重构数据库架构的某一阶段,可以在更改它访问的表的同时,使代码继续工作。

b: 可以使用视图实现列权限,但是却没有实际创建这些权限的开销

create view v1 as select salary,name from salarie;
grant select on v1.* to user1;

视图的局限:

a:mysql不支持物化视图,物化视图通常把结果存储在一个不可见的表里面,然后周期性的从原始数据对不可见的表进行刷新。

b: mysql 也不支持索引视图,  可以通过创建缓存表和汇总表模拟物化视图和索引视图。

15:字符集和排序规则  https://www.cnblogs.com/wcwen1990/p/6917109.html

a:为什么不都用utf-8,  因为utf-8 占用的字节比较大。

b:

16:全文搜索

a: myisam全文索引是一种特殊的具有两层结构的B树,第一层保存了关键字,然后对每个关键字,第二层包含了一个列表,它有相关的文档指针组成,这些指针包含该关键字的全文集合。

b:查询索引

mysql> show index from salarie;
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| Table   | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
| salarie |          0 | id       |            1 | id          | A         |          27 | NULL     | NULL   |      | BTREE      |         |               |
+---------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+
1 row in set

17:合并表和分区表

合并表:

drop table t1;
drop table t2;
drop table mrg;
create table t1(a int)engine=MyISAM;
create table t2(a int)engine=MyISAM;
insert into t1 values(1),(2);
insert into t2 values(1),(2);
create table mrg(a int) engine=merge union(t1,t2) insert_method=last;
select * from mrg;

报错

1168 - Unable to open underlying table which is differently defined or of non-MyISAM type or doesn't exist

是因为merge默认引擎没写:修改如下

create table mrg(a int) engine=merge union(t1,t2) insert_method=last default charset=utf8;

结果:

mysql> drop table t1;
drop table t2;
drop table mrg;
create table t1(a int)engine=MyISAM;
create table t2(a int)engine=MyISAM;
insert into t1 values(1),(2);
insert into t2 values(1),(2);
create table mrg(a int) engine=merge union(t1,t2) insert_method=last default charset=utf8;
select * from mrg;

Query OK, 0 rows affected

+---+
| a |
+---+
| 1 |
| 2 |
| 1 |
| 2 |
+---+
4 rows in set

在合并表中插入,能够在指标中查询到

mysql> insert into mrg values(3);
Query OK, 1 row affected

mysql> select * from t2;
+---+
| a |
+---+
| 1 |
| 2 |
| 3 |
+---+
3 rows in set

分区表:

分区表,可以按照日期分区,如果一个表很大,例如每天插入10000000条记录,时间长了,表中数据原来越大,使用主键全表扫面,性能较低。

于是,可以按日期对表进行分区,每次查询访问某个时间段即可。

但是不要同时加上主键和对表进行分区,这有可能降低性能。尤其是要对所有分区进行扫描的时候,在考虑分区时,要仔细地做性能评测,因为分区表并不总是能提高性能。

分区表使用和示例:

 创建一个表,对其分区

create table sales_by_day(
    day date not null,
    product int not null,
    sales decimal(10,2) not null,
    returns decimal(10,2) not null,
    primary key(day,product)
)engine=innodb;


alter tables sales_by_day partition by range(year(day))(
    partition p_2006 values less than (2007),
    partition p_2007 values less than (2008),
    partition p_2008 values less than (2009),
    partition p_catchall values less than maxvalue);
    
insert into sales_by_day(day,product,sales,returns) values
('2007-01-15',19,50.00,52.00),
('2008-01-15',11,41.00,42.00);

 分区表一个常用的用途就是分布大表中的行。

alter table very_big_table partition by key(<primary key columns>)(
partition p0 data direcotry='/data/mydb/big_table_p0',
partition p1 data direcotry='/data/mydb/big_table_p1'
);
原文地址:https://www.cnblogs.com/liyafei/p/9536630.html