云平台服务器应急检查步骤

云平台服务器应急检查步骤

版本1.0

 

一、      制订目的

规范运维人员处理应急事件步骤,尽快解决用户故障,特制定此规范,并于制定之日起正式实施,对于未按规范严格执行的人员将进行相应处罚。

二、      WINDOWS服务器检查项目

1、  安装防病毒软件Symantec SEP 14U1,并升级病毒包到最新。

下载地址:链接:http://pan.baidu.com/s/1sluRPQt 密码:spl3

2、  WINDOWS系统补丁。

使用WindowsUpdate功能将系统补丁打到最新,如操作系统无法更新,使用WindowsUpdateOffline进行升级。

下载地址:链接:http://pan.baidu.com/s/1dEIGCTz 密码:t01f

3、  WINDOWS系统C:磁盘空间<10g就十分危险了,如果需要查看具体哪个目录占用了大量磁盘,可以使用SpaceSniffer这个工具。

下载地址:链接:http://pan.baidu.com/s/1pLyZLwR 密码:404v

4、  WINDOWS系统需要激活,如咱们激活不负责版权问题。

破解工具下载地址:http://kmspico10.com/

5、  WINDOWS系统自动登录

设置开机自动用户登录

开始>运行 control userpasswords2 ,出现(如图1),选择要自动登录的用户账户,然后将“要使用本机,用户必须输入用户名和密码”前面的勾去掉(如图2),然后点确定出现自动登录对话框,输入密码(如图3)点确定。

 

 

 6、  处理程序执行Watcher

      禁止在不开启Watcher的情况下,独立启用WinFormGetSwf.exe

三、      Linux服务器检查项目

发现访问缓慢

1、  检查TOMCAT

wget http://127.0.0.1:8080/dsideal_yy/adminlogin/captchaText

ps -ef | grep tomcat

2、  检查MYSQL连接数

这里需要细化!!!

3、  IO读写效率


1) df -h 查找出 磁盘分区的名称
(2) hdparm -t /sda1

标准:Timing buffered disk reads:不低于 200mb/s

4、  检查SSDB是否启动

cd /usr/local/ssdb && ./ssdb-cli

set abc 1

5、  检查REDIS是否启动

redis-cli -p 18890 set abc 1

重点检查是不是服务挂了,并且检查一下反应时间长短。

6、  将海沧的TOMCAT JVM 内存大小,设为标准配置。

7、  MYSQL 空闲连接超时时间30

8、  查看CPU使用率+ 查看内存使用率。

执行 top

11、              查看磁盘是否挂载

12、              查看MYSQL错误 日志

split -a 2 -d -b 1m /usr/local/tomcat7/logs/catalina.out cata_split_ 

13、              查看MYSQL慢查询

14、              查看NGINX是否启动

二、      Redis过大,加载时间长,导致系统重启后Tomcat无法启动

办法:在客户服务器安装Python3.6.2并且运行一次黄海开发的StartTomcat.py

链接:http://www.cnblogs.com/littlehb/p/7645118.html

此脚本为自动在/etc/rc.local中添加自动启动代码,并删除/usr/local/tomcat7/bin/startup.sh.

四、      各类服务异常终止,导致程序异常。

办法:安装并运行吴缤开发的进程检查程序。

五、      系统掉电,用户反馈时,才能去解决。

办法:需要第三方服务支持!

六、      磁盘掉了,挂载失败。

办法:

检查 /usr/local/checkdisk.sh 文件是不是存在,里面的内容是不是满足当前地区的服务配置。

链接:http://www.cnblogs.com/littlehb/p/7645100.html

~

原文地址:https://www.cnblogs.com/littlehb/p/7645151.html