Mysql数据库监控要做好哪些?

对应Msql数据库需要监控什么?怎么对这些要监控的资源进行监控

对数据库服务的可用性进行监控
并不是在数据库服务器写一个脚本监控数据库的进程或者端口是否存在,仅仅这一点是不够的,数据库的进程或者端口存在并不意味着数据库可以对外提供服务,必须实际的通过网络连接到数据库中,并且在数据库中执行一些简单的脚本或者SQL,这样才能保证数据库是可用的。

对数据库性能进行监控
QPS和TPS、并发线程数量监控,并发线程数并不等于数据库连接数,而是指数据库同时在处理的SQL请求数量,其实并发线程数是远远小与数据库连接数的。
QPS是数据库每秒钟所执行的数量,并不仅仅是select,是所有请求;TPS指的是每秒钟所处理的事务的数量,update、delete、insert的请求数量,从意义上讲QPS是TPS的子集。

并发数监控
通常情况下,数据库系统的性能会随着并发处理请求数量的增加而下降,通常这个指标要和CPU的使用率结合来分析。
show global status like 'Threads_running',并发处理的数量通常会远小于同一时刻连接到数据库的线程数量。如果发现某一时刻数据库并发量增大,就要检查一下数据库是否异常,是否有大量阻塞,如果有大量阻塞,那么有可能出现并发数量的突增,就会把可连接数沾满,导致无法正常使用。

对Innodb阻塞和死锁进行监控

//查询所有阻塞超过60秒的语句,这个语句只对innodb有效
select b.trx_mysql_thread_id as '被阻塞线程',b.trx_query as '被阻塞SQL',c.trx_mysql_thread_id as '阻塞线程',c.trx_query as '阻塞SQL',(UNIX_TIMESTAMP()-UNIX_TIMESTAMP(c.trx_started)) as '阻塞时间' from information_schema.innodb_lock_waits a join information_schema.innodb_trx b on a.requesting_trx_id=b.trx_id join information_schema.innodb_trx c on a.blocking_trx_id=c.trx_id where (UNIX_TIMESTAMP()-UNIX_TIMESTAMP(c.trx_started)) > 60; 

对主从复制进行监控
主从复制链路状态的监控、主从复制延迟的监控、定期确认主从数据是否一致。

对服务器资源进行监控
磁盘空间
虽然现在服务器的磁盘空间都很大,能达到几T甚至十几T,有时候因为磁盘空间被沾满造成mysql对外服务的故障。服务器的磁盘空间大并不意味着Mysql服务使用的磁盘空间大。

对CPU的使用情况

内存的使用情况,swap分区的使用情况以及网络IO的情况做监控。

Mysql服务器上所使用的TCP/IP连接存在有可能被沾满的情况

SELECT    
p2.`HOST` 被阻塞方host,
p2.`USER` 被阻塞方用户,
r.trx_id 被阻塞方事务id,    
        r.trx_mysql_thread_id 被阻塞方线程号,    
        TIMESTAMPDIFF(    
            SECOND,    
            r.trx_wait_started,    
            CURRENT_TIMESTAMP    
        ) 等待时间,    
        r.trx_query 被阻塞的查询,    
        l.lock_table 阻塞方锁住的表,  
        m.`lock_mode` 被阻塞方的锁模式,
        m.`lock_type`  "被阻塞方的锁类型(表锁还是行锁)",
        m.`lock_index` 被阻塞方锁住的索引,
        m.`lock_space` 被阻塞方锁对象的space_id,
        m.lock_page 被阻塞方事务锁定页的数量,
        m.lock_rec 被阻塞方事务锁定行的数量,
        m.lock_data  被阻塞方事务锁定记录的主键值,  
        p.`HOST` 阻塞方主机,
        p.`USER` 阻塞方用户,
        b.trx_id 阻塞方事务id,    
        b.trx_mysql_thread_id 阻塞方线程号, 
        b.trx_query 阻塞方查询, 
        l.`lock_mode` 阻塞方的锁模式,
        l.`lock_type` "阻塞方的锁类型(表锁还是行锁)",
        l.`lock_index` 阻塞方锁住的索引,
        l.`lock_space` 阻塞方锁对象的space_id,
        l.lock_page 阻塞方事务锁定页的数量,
        l.lock_rec 阻塞方事务锁定行的数量,
        l.lock_data 阻塞方事务锁定记录的主键值,         
      IF (p.COMMAND = 'Sleep', CONCAT(p.TIME,''), 0) 阻塞方事务空闲的时间           
    FROM    
        information_schema.INNODB_LOCK_WAITS w    
    INNER JOIN information_schema.INNODB_TRX b ON b.trx_id = w.blocking_trx_id    
    INNER JOIN information_schema.INNODB_TRX r ON r.trx_id = w.requesting_trx_id    
    INNER JOIN information_schema.INNODB_LOCKS l ON w.blocking_lock_id = l.lock_id  AND l.`lock_trx_id`=b.`trx_id`
      INNER JOIN information_schema.INNODB_LOCKS m ON m.`lock_id`=w.`requested_lock_id` AND m.`lock_trx_id`=r.`trx_id`
    INNER JOIN information_schema. PROCESSLIST p ON p.ID = b.trx_mysql_thread_id   
 INNER JOIN information_schema. PROCESSLIST p2 ON p2.ID = r.trx_mysql_thread_id 
    ORDER BY    
        等待时间 DESC \G;
原文地址:https://www.cnblogs.com/wt645631686/p/9723146.html