Slave_SQL_Runing:NO 复制出现问题的解决办法

--Slave_SQL_Runing:NO 复制出现问题的解决办法

-------------------------------------------------------2014/05/21

Slave_SQL_Running: No mysql同步故障解决
     今天检查数据库发现一台MySQL Slave未和主机同步,查看Slave状态:
mysql> show slave statusG
  Slave_IO_Running: Yes
  Slave_SQL_Running: No
  Last_Errno: 1062 .... Seconds_Behind_Master:NULL
原因: 1.程序可能在slave上进行了写操作 2.也可能是slave机器重起后,事务回滚造成的.
解决办法I:
1.首先停掉Slave服务:slave stop
2.到主服务器上查看主机状态: 记录File和Position对应的值。
mysql> show master status;
+------------------+-----------+--------------+------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB |
+------------------+-----------+--------------+------------------+
| mysql-bin.000020 | 135617781 | |
| +------------------+-----------+--------------+------------------+
1 row in set (0.00 sec)
3.到slave服务器上执行手动同步:
mysql> change master to
  > master_host='master_ip',
  > master_user='user',
  > master_password='pwd',
  > master_port=3307,
  > master_log_file='mysql-bin.000020',
  > master_log_pos=135617781;
1 row in set (0.00 sec)
mysql> slave start; 1 row in set (0.00 sec) 再次查看slave状态发现:
  Slave_IO_Running: Yes
  Slave_SQL_Running: Yes ...
  Seconds_Behind_Master: 0
 
方法一是强制性从某一个点开始同步,会有部分没有同步的数据丢失,后续主服务器上删除记录同步也会有一些错误信息,不会影响使用.
 
解决办法II:
使用SQL_SLAVE_SKIP_COUNTER参数
mysql> slave stop;
mysql> set GLOBAL SQL_SLAVE_SKIP_COUNTER=1;
mysql> slave start;
 
关于此参数的说明。

背景知识1:

    在主从库维护中,有时候需要跳过某个无法执行的命令,需要在slave处于stop状态下,执行 set global sql_slave_skip_counter=N以跳过命令。常用的且不易用错的是N=1的情况,但N>1时,则不那么顾名思义,本文详细介绍N的意义,及使用注意事项。

 

    背景知识2:

    MySQL从库从主库上复制binlog文件内容到本地执行。在binlog上命令以event的形式存在,并非一个命令对应一个event。以一个insert语句为例(引擎InnoDB、binglog_format=statement), 在binlog中实际上有三个event,分别为begininsertcommit 。 命令类型都是Query_log_event.

 

    而set global sql_slave_skip_counter=N的意思,即为在start slave时,从当前位置起,跳过N个event。每跳过一个event,则N--.

 

    与实际情况不符?

    看到这里有同学就会问,这是有问题的。如果当前的执行位置是某个insert语句开头,那使用 N=1实际上是从begininsertcommit的第二个开始执行,这个insert语句还是不能被跳过?

    实际上这里还有两个策略:

    1、若N=1且当前event为BEGIN, 则N不变,跳过当前event继续。

    2、若N=1且当前event处于一个事务之内(BEGIN之后,COMMIT之前),则N不变,跳过当前event继续。

 

     说明:其实上面两个策略合起来就是一句话,当N=1时,会连续跳过若干个event,直到当前所在的事务结束。

    当然如果N>1,则每跳过一个event都要N--.

 

    命令举例:

    所以我们平时最常用的N=1的情况,都是下一个事务

    假设某个Pos之后执行如下命令( 引擎InnoDB、binglog_format=statement),

    insert into t values(x1);

    begin;

    insert into t values(x2);

    insert into t values(x3);

    commit;

   insert into t values(x4);

你的从库stop在Pos上,假设你要跳过前面几个命令直接执行插入x4的操作,则你的N设置为 4或5或6或7均可。(X1语句为3个event)

 

   其他说明:

   上面举例中都特别说明了在innodb引擎和statement模式下。其他情况区别如下:

   1、若引擎为myisam(等不支持事务的引擎),且在statement下,则binlog中不会有begin和commit,每个命令都是一个event;

   2、row模式的binlog里,一个insert语句实际上是两个event(Table_map_event和 Row_log_event), 计算时应与statement不同。

  3、在row模式下,不论引擎是否支持事务,一个insert语句都会加上BEGIN和commit,也即变成4个event。

  4、基于InnoDB引擎表的insert/delete/update操作都有显式样的BEGIN /COMMIT.

 

  上面举的这个例子中,若为row模式,则要直接执行X4语句需要设置的N为 5~10均可。

 

   小结:

   1、set global sql_slave_skip_counter=N中的N是指跳过N个event

   2、最好记的是N被设置为1时,效果跳过下一个事务

   3、跳过第N个event后,位置若刚好落在一个事务内部,则会跳过这整个事务

   4、一个insert/update/delete不一定只对应一个event,由引擎和日志格式决定

原文地址:https://www.cnblogs.com/jackhub/p/3741324.html