线上服务异常排查

日志异常排查

相关指令:

tail、cat、less 、grep 、wc、sed、split

#常用日志查询 
#滚动加载日志
tail -f xxx.log

#查看日志部分加载 配合指令进行查看 g(首页) G(末页)  j(上一行) k(下一行) PgUp(上一页) pgDn(下一页) 
# /(关键字查询) n(关键字向上搜索)  N(关键词的向下搜索) q(退出)
less xxx.log  

#查看日志 配套使用过滤关键字排查问题
cat -n xxx.log |grep '关键字' (-A|-B|-C) 行数

#日志分割截取便于定位问题
#使用sed 脚本操作文件
#按照时间点进行分割
sed -n '/2021-03-19 05:00:00/,/2021-03-19 05:15:00/p' xxx.log
#按照行数进行分割
sed -n '10,100p' xxx.log


#使用split进行分割日志
#按照每个文件1000行进行分割
split -l 1000 xxx.log
#按照每个文件1000行进行分割 指定文件前缀
split -l 1000 xxx.log  split_
#按照每个文件1000行进行分割 指定文件前缀 -d 表示指定后缀为数字 -a 4表示 4位数字
split -l 1000 xxx.log  split_ -d -a 4

服务端口和ip/网络问题排查

相关指令:

lsof、netstat 、ping、telnet

#尝试ping通网络
ping 192.168.7.127
ping newrank.cn

#尝试检测是否能够访问对应端口(前提是对应服务的ip和端口是开放的)
telnet 192.168.7.37 8225

#检测指定端口是否开启
lsof -i:8225

#查看当前服务器已开放的端口号(也可以配合grep查询指定的端口开放情况)
netstat -ntulp 

服务器cpu/内存/磁盘/进程

相关指令:

top、free、df、du、ps

#查询当前进程内存cpu等消耗情况
top

#查看当前服务器内存情况 -m
free

#查询当前服务器磁盘情况 一般配合 -h 使用可读性更强
df 

#查询指定的目录或文件所占用的磁盘空间。 一般配合 -sh 使用查看整体文件情况
du

#进程查看 常用配套 -ef  -aux  -a  -u  grep
ps

#查看进程树
pstree

杀死进程

#查看当前消耗cpu最大的进程
top 
#尝试杀掉该进程
kill -9 pid
#若杀死进程后,进程又重启了,查询该进程的父进程(ppid)
cat /proc/pid/status
#尝试杀死父进程再杀自进程
kill -9 ppid  & kill -9 pid
#若存病毒依然挺拔,找出进程对应的执行启动文件
ls -l /proc/pid/exe
#找到对应执行文件尝试删除该文件
rm -rf  ...
#再次杀死病毒进程
kill -9 pid
作者:donleo123
本文如对您有帮助,还请多推荐下此文,如有错误欢迎指正,相互学习,共同进步。
原文地址:https://www.cnblogs.com/donleo123/p/15621309.html