linux 学习 13 系统管理

第十三讲 Linux系统管理
13.1.1进程管理-进程查看
13.1.2进程管理-终止进程
13.2工作管理
13.3系统资源查看
13.4系统定时任务

13.1.1进程管理-进程查看

1、进程简介 
进程是正在执行的一个程序或命令,每一个进程都是一个运行的实体,都有自己的地址空间,并占用一定的系统资源。 

2、进程管理的作用 
判断服务器健康状态 
查看系统中所有进程 
杀死进程 

3、查看系统中所有进程 
[root@localhost ~]# ps aux 
#查看系统中所有进程,使用BSD操作系统格式 
[root@localhost ~]# ps -le 
#查看系统中所有进程,使用Linux标准命令格式。


USER:该进程是由哪个用户产生的; 
PID:进程的ID号; 
%CPU:该进程占用CPU资源的百分比,占用越高,进程越耗费资源; 
%MEM:该进程占用物理内存的百分比,占用越高,进程越耗费资源; 
VSZ:该进程占用虚拟内存的大小,单位KB; 
RSS:该进程占用实际物理内存的大小,单位KB; 
TTY:该进程是在哪个终端中运行的。其中tty1-tty7代表本地控制台终端,tty1-tty6是本地的字符界面终端,tty7是图形终端。pts/0-255代表虚拟终端
(远程终端)。 


STAT:进程状态。常见的状态有:R:运行、S:睡眠、T:停止状态、s:包含子进程、+:位于后台 
START:该进程的启动时间 
TIME:该进程占用CPU的运算时间,注意不是系统时间 
COMMAND:产生此进程的命令名 

4、查看系统健康状态 [root@localhost ~]# top [选项]
 选项: 
-d 秒数: 指定top命令每隔几秒更新。默认是3秒 
在top命令的交互模式当中可以执行的命令: 
?或h: 显示交互模式的帮助 
P: 以CPU使用率排序,默认就是此项 
M: 以内存的使用率排序 
N: 以PID排序 
q: 退出top


第一行信息为任务队列信息 内容     说明 
12:26:46     系统当前时间 
up 1 day, 13:32     系统的运行时间,本机已经运行1天13小时32分钟 
2 users     当前登录了两个用户 
load average: 0.00, 0.00, 0.00     系统在之前1分钟,5分钟,15分钟的平均负载。一般认为小于1时,负载较小。如果大于1,系统已经超出负荷。 

第二行为进程信息 内容     说明 
Tasks: 95 total     系统中的进程总数 
1 running     正在运行的进程数 
94 sleeping     睡眠的进程 
0 stopped     正在停止的进程 
0 zombie     僵尸进程。如果不是0,需要手工检查僵尸进程 

第三行为CPU信息 内容     说明 
Cpu(s): 0.1%us     用户模式占用的CPU百分比 
0.1%sy     系统模式占用的CPU百分比 
0.0%ni     改变过优先级的用户进程占用的CPU百分比 
99.7%id     空闲CPU的CPU百分比 
0.1%wa     等待输入/输出的进程的占用CPU百分比 
0.0%hi     硬中断请求服务占用的CPU百分比 
0.1%si     软中断请求服务占用的CPU百分比 
0.0%st     st(Steal time)虚拟时间百分比。就是当有虚拟机时,虚拟CPU等待实际CPU的时间百分比。 

第四行为物理内存信息 内容     说明 
Mem: 625344k total     物理内存的总量,单位KB 
571504k used     已经使用的物理内存数量 
53840k free     空闲的物理内存数量,我们使用的是虚拟机,总共只分配了628MB内存,所以只有53MB的空闲内存了 
65800k buffers     作为缓冲的内存数量 


第五行为交换分区(swap)信息 内容     说明 
Swap: 524280k total     交换分区(虚拟内存)的总大小 
0k used     已经使用的交互分区的大小 
524280k free     空闲交换分区的大小 
409280k cached     作为缓存的交互分区的大小 


5、查看进程树 [root@localhost ~]# pstree [选项] 
选项: 
-p: 显示进程的PID 
-u: 显示进程的所属用户

13.1.2进程管理-终止进程

1、kill命令 
[root@localhost ~]# kill –l 
#查看可用的进程信号


信号代号    信号名称     说明 
1     SIGHUP     该信号让进程立即关闭,然后重新读取配置文件之后重启。 
2     SIGINT     程序终止信号,用于终止前台进程。相当于输出ctrl+c快捷键。 
8     SIGFPE     在发生致命的算术运算错误时发出. 不仅包括浮点运算错误, 还包括溢出及除数为0等其它所有的算术的错误。 
9     SIGKILL     用来立即结束程序的运行. 本信号不能被阻塞、处理和忽略。一般用于强制终止进程。 
14     SIGALRM     时钟定时信号, 计算的是实际的时间或时钟时间. alarm函数使用该信号。 
15     SIGTERM     正常结束进程的信号,kill命令的默认信号。有时如果进程已经发生问题,这个信号是无法正常终止进程的,我们才会尝试SIGKILL信号,也就是信号9。 
18     SIGCONT     该信号可以让暂停的进程恢复执行,本信号不能被阻断。 
19     SIGSTOP     该信号可以暂停前台进程,相当于输入ctrl+z快捷键。本信号不能被阻断。 


[root@localhost ~]# kill -1 22354   // 1,9,15
#重启进程 
[root@localhost ~]# kill -9 22368 
#强制杀死进程

2、killall命令 
[root@localhost ~]# killall [选项][信号] 进程名 
#按照进程名杀死进程 
选项: 
-i: 交互式,询问是否要杀死某个进程 
-I: 忽略进程名的大小写


3、pkill命令 
[root@localhost ~]# pkill [选项] [信号] 进程名 
#按照进程名终止进程 
选项: 
-t 终端号: 按照终端号踢出用户


按照终端号踢出用户 
[root@localhost ~]# w 
#使用w命令查询本机已经登录的用户 
[root@localhost ~]# pkill -t -9 pts/1 
#强制杀死从pts/1虚拟终端登录的进程


13.2工作管理

1、把进程放入后台 //相当于windows中把一个窗口最小化
----tar -zcf etc.tar.gz /etc &   // 后台继续运行
                                                                                                ----[root@localhost ~]# top #在top命令执行的过程中,按下ctrl+z快捷键 //这种方法后台暂停运行

2、查看后台的工作 
[root@localhost ~]# jobs [-l] 
选项: 
-l: 显示工作的PID 
注:“+”号代表最近一个放入后台的工作,也是工作恢复时,默认恢复的工作。“-”号代表倒数第二个放入后台的工作

3、将后台暂停的工作恢复到前台执行 [root@localhost ~]# fg %工作号 参数: %工作号: %号可以省略,但是注意工作号 和PID的区别

4、把后台暂停的工作恢复到后台执行 
[root@localhost ~]# bg %工作号 
注:后台恢复执行的命令,是不能和前台有交互的,否则不能恢复到后台执行
//就是不需要和用户有交互

13.3系统资源查看

1、vmstat命令监控系统资源 
[root@localhost ~]# vmstat [刷新延时 刷新次数] 
例如: [root@localhost proc]# vmstat 1 3
// 相当于结合了top 和 ps, 更为直观一些,我们关心的是mem free, 以及cpu id 这两个资源

2、dmesg开机时内核检测信息 
[root@localhost ~]# dmesg 
[root@localhost ~]# dmesg | grep CPU
//查看硬件信息

3、free命令查看内存使用状态 
[root@localhost ~]# free [-b|-k|-m|-g] 
选项: 
-b: 以字节为单位显示 
-k: 以KB为单位显示,默认就是以 KB为单位显示 
-m: 以MB为单位显示 
-g: 以GB为单位显示

缓存和缓冲的区别 
简单来说缓存(cache)是用来加速数据从硬盘中“读取”的,而缓冲(buffer)是用来加速数据“写入”硬盘的。 
//内存速度比硬盘快。例如,1600M
硬盘,固态硬盘,传输接口,传输线速度。 500M。
物理硬盘, 几十M。 

从硬盘读,保存在内存的缓存中,以加速数据的读取
缓冲,加速数据的写入。等数据够多了,再一起处理,进行下一步操作。

4、查看CPU信息 [root@localhost ~]# cat /proc/cpuinfo

//proc 内容断电消失,启动时重新写入

5、uptime命令 
[root@localhost ~]# uptime 
#显示系统的启动时间和平均负载,也就是top命令的第一行。w命令也可以看到这个数据。
//top 命令的第一行

6、查看系统与内核相关信息 
[root@localhost ~]# uname [选项] 
选项: 
-a: 查看系统所有相关信息; 
-r: 查看内核版本; 
-s: 查看内核名称。

判断当前系统的位数 [root@localhost ~]# file /bin/ls

查询当前Linux系统的发行版本 [root@localhost ~]# lsb_release -a

7、列出进程打开或使用的文件信息 
[root@localhost ~]# lsof [选项] 
#列出进程调用或打开的文件的信息 
选项: 
-c 字符串: 只列出以字符串开头的进程打开 的文件 
-u 用户名: 只列出某个用户的进程打开的文 件 
-p pid: 列出某个PID进程打开的文件

13.4系统定时任务

1、crond服务管理与访问控制 
[root@localhost ~]# service crond restart 
[root@localhost ~]# chkconfig crond on
//一般默认自启动和启动

2、用户的crontab设置 
[root@localhost ~]# crontab [选项] 
选项: 
-e: 编辑crontab定时任务 
-l: 查询crontab任务 
-r: 删除当前用户所有的crontab 任务

[root@localhost ~]# crontab -e 
#进入crontab编辑界面。会打开vim编辑你的工作。 
* * * * * 执行的任务

项目     含义     范围 
第一个“*”     一小时当中的第几分钟     0-59 
第二个“*”     一天当中的第几小时     0-23 
第三个“*”     一个月当中的第几天     1-31 
第四个“*”     一年当中的第几月     1-12 
第五个“*”     一周当中的星期几     0-7(0和7都代表星期日) 

时间     含义 
45 22 * * * 命令     在22点45分执行命令 
0 17 * * 1 命令     每周1 的17点0分执行命令 
0 5 1,15 * * 命令     每月1号和15号的凌晨5点0分执行命令 
40 4 * * 1-5 命令     每周一到周五的凌晨4点40分执行命令 
*/10 4 * * * 命令     每天的凌晨4点,每隔10分钟执行一次命令 
0 0 1,15 * 1 命令     每月1号和15号,每周1的0点0分都会执行命令。注意:星期几和几号最好不要同时出现,因为他们定义的都是天。非常容易让管理员混乱。 

举例 
*/5 * * * * /bin/echo ”11” >> /tmp/test 
5 5 * * 2 /sbin/shutdown -r now 
0 5 1,10,15 * * /root/sh/autobac.sh

定时任务没有执行,看cron日志
/var/log/cron这个文件就可以,可以用tail -f /var/log/cron观察

autoba.sh

#!/bin/bash

date=$(date +\%y\%m\%d)      #//  必须加上,因为%在定时命令中有其它的含义
size=$(du -sh /etc)

echo "Date : $date!" > /tmp/dbback/dbinfo.txt    #文件夹和文件必须事先存在
echo "Date size : $size!" > /tmp/dbback/dbinfo.txt
cd /tmp/dbback
tar -zcf etc_$date.tar.gz /etc /tmp/dbback/binfo.txt &>/dev/null
rm -rf /tmp/dbback/dbinfo.txt
原文地址:https://www.cnblogs.com/aprilapril/p/5578430.html