切记!节前给数据库做个巡检

还有一周即将进入漫长的春节假期,作为一名运维人员既兴奋又惶恐,因为根据多年经验假期往往也是故障的高发期,特别是数据库,很多公司安排了DBA春节现场值班,二线专家7*24小时随时待命。

有人无法与家人团聚,有人错过高中同学十年聚会,有人要背着电脑去给丈母娘拜年,有人在放假前给服务器祈祷:

640?wx_fmt=jpeg

但是故障往往都是一步步演变而来,最终发展成为影响业务连续性的事故,而这些故障的演变过程通常都会体现在日志和其他记录中,通过前期巡检就可以发现故障的蛛丝马迹,将其扼杀在摇篮中。加上数据库假期长时间无人看管,所以节前千万不要忘了给数据库做个巡检。

人工巡检耗时耗力,而且往往会漏掉巡检项,现在登录墨天轮云服务平台,只需三步(3-5分钟)即可快速完成一份数据库的专业巡检工作:下载脚本采集、上传巡检结果、立即查看报告。另外,我们后期会陆续推出MySQL、SQL Server、PG数据库的巡检功能,敬请关注

  • 采集脚本可以在所有系统上运行,包括Windows,支持Oracle 10g到12c所有版本,不采集任何业务数据,运行时自我监控,如遇CPU使用率过高、磁盘空间不足的情况下会自动终止采集程序。

  • 调用白求恩智能分析引擎,针对隐患瓶颈分析总结,提供解决方案

  • 还有Eygle、老杨等数据库专家在线免费帮您二次审核报告

640?wx_fmt=png


这里我们总结了比较重要且容易忽略的巡检项及可能存在的问题

  1. 空间使用率:文件系统、表空间、ASM可用空间不足的致命问题

  2. 运行趋势:了解主机、数据库负载情况,近期是否存在高点或者持续增长的趋势

  3. 参数:主机、ASM、数据库(特别是重启后会变化的参数)

  4. 日志:系统日志、DB告警日志、ASM日志里的报错信息

  5. 网络配置,监听:检查网络配置、监听参数和状态,是否存在连接风暴和监听日志大于4G的问题

  6. 失效对象:建议排查及时删除或重新编译

  7. SCN:Headroom问题和2019年6月23日自动解除最大SCN限制对当前环境是否影响的检查,以及需要做的应对措施

  8. 系统触发器木马:盗版PL/SQL DEV注入的比特币勒索病毒以及非官方安装包注入清空tab$的木马,前者在建库1200天后、后者在建库300天后触发,如果中招及时发现并处理

  9. 用户安全:用户即将过期锁定导致应用无法连接,另外假期收回或者锁定有DBA、ANY等高权限的用户

  10. 重做日志:了解切换规律,如果存在无法分配新日志的报错,建议增加日志组

  11. DBLINK:梳理数据库中的DBLINK

  12. RMAN备份检查:检查备份策略是否合理,另外节前最好做一次全备

  13. DG检查:确保正常同步,可正常切换

现在登录云平台来巡检吧,全面检查,安心过节:https://cs.enmotech.com/cloudPlatform

另外我们推出了3个等级的年度云服务,可7*24小时全天候响应,最快15分钟内接入处理故障,还有数据救援、节日保障等单次服务,如果遇到故障可以直接联系我们。(阅读原文查看服务列表)

原文地址:https://www.cnblogs.com/hzcya1995/p/13312170.html