日常运维管理技巧一(查看负载 W)

日常运维管理技巧一(查看负载 W)

今天针对Linux系统管理做一个专题的记录,以后会用的几率也是很大的,只要掌握必备的基础知识,做初级系统管理员是不成问题的。

作为一个运维工程师、系统管理员,如果对自己的系统不了解的话,那怎么排查问题呢?如果出现问题的话,肯定要查一下是什么问题,哪里的问题,系统的资源的耗费情况如何查看。

一、使用w命令查看当前系统的负载

1.1 系统时间查看,使用date命令也可以查看当前时间

1.2 系统运行时间,uptime

1.3  登陆了几个用户

从上面可以看到登录了哪个终端。如果是网络登录的话,终端是ps/0,ps/1这些;

如果是系统登录,会出现tty1,tty1- tty6是6个终端。from是可以看出从哪里来的。

1.4 load average是关键的一段,这是它的系统负载,平时用的最多的就是这一部分了

它后面跟三个数字,分别是1分钟、5分钟、15分钟内系统的平均负载值。

]第一个数字是单位时间内使用CPU的活动的进程有多少个,值越大说明服务器压力越大。这个数字可以是零点几,也可以是一百多,当前值是0,说明系统没有负载,就没有活动的进程,这说明服务器处于空闲的状态。这对于Linux操作系统来讲就比较浪费,它在空耗。

那什么值是理想状态呢?看你有几颗CPU,这个指的是逻辑CPU,而不是物理CPU。CPU有很多类型,Intel的,AMD的,都会有几颗CPU,每颗上又会有很多逻辑CPU。查看CPU的命令如下:cat /proc/cpuinfo,需要查看的数字是processor。

如果是0,就代表有1颗;是1代表是2颗;如果有39,就代表有40颗,翻到最后一页就可以看出你的cpu数量。

这里说的是逻辑CPU,而不是物理CPU。processor的最大数字是7,代表最多有8颗CPU,只要w命令查到的数字不大于8,就是可以的。

LOGIN@是登陆的时间,IDLE是空闲了多长时间,PCPU是使用CPU的时间,WHAT是适用的命令,后面的可以不用管它。

注:/proc/cpuinfo文件记录了CPU的详细信息。目前市场上多为2颗多核CPU,在Linux看来,它就是2*n个CPU(n为单颗物理CPU上有几核)。如果n为4,则查看这个文件时会显示8段信息,而最后一段信息的processor会显示7,查看当前系统有几个CPU,可以使用命令grep -c 'processor' /proc/cpuinfo。然后查看有几颗物理CPU时,则需要查看关键字physical id。

原文地址:https://www.cnblogs.com/scwbky/p/10320545.html