Linux 不杀进程的情况下,如何释放磁盘资源


最近项目组人员反馈一个问题:即磁盘空间满了,但是并没看到有什么文件占用空间:

[root@xxxx home]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/xvda2             40G  6.4G   31G  18% /
tmpfs                 7.8G     0  7.8G   0% /dev/shm
/dev/xvda1            190M   46M  135M  26% /boot
/dev/xvda3             40G   39G   0G  100% /home
/dev/xvda5             40G   49M   38G   1% /tmp
[root@xxxx home]# pwd
/home
[root@xxxx home]# du -sh
5.4G    .
[root@IHSwaiwang7 home]# ls -a
.  ..  appuser  ftp_dir  linux  lost+found

  

为什么磁盘空间大小显示不准确呢?
有隐藏文件?还是其他原因?
du -sh 命令统计了整体的空间使用率,隐藏文件也能被统计进去。
ls -lah 也没看到有问题的文件

然后想到是不是有些文件被删除,但是资源并未释放呢?
在Linux或者Unix系统中,通过rm或者文件管理器删除文件将会从文件系统的目录结构上解除链接(unlink).然而如果文件是被
打开的(有一个进程正在使用),那么进程将仍然可以读取该文件,磁盘空间也一直被占用。

查看被打开的已删除文件:

[root@xxxx home]# lsof -n | grep deleted
java 27319 root 1w REG 202,3 25981280125 790834 /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
java 27319 root 2w REG 202,3 25981280125 790834 /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
java 27319 root 8w REG 202,3 1224 790864 /home/appuser/tomcat7-MIR-20012/logs/localhost.2017-10-23.log (deleted)
java 27319 root 42w REG 202,3 273 789028 /home/appuser/tomcat7-MIR-20012/logs/localhost_access_log.2018-03-14.txt (deleted)
java 39917 root 8w REG 202,3 1221 790840 /home/appuser/tomcat7-IMR-20010/logs/localhost.2017-10-18.log (deleted)
java 55250 root 7w REG 202,3 19906 790794 /home/appuser/tomcat7-MIR-20012/logs/catalina.2018-02-03.log (deleted)
java 55250 root 8w REG 202,3 1837 790795 /home/appuser/tomcat7-MIR-20012/logs/localhost.2018-02-03.log (deleted)
java 55516 root 1w REG 202,3 12643031059 788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)
java 55516 root 2w REG 202,3 12643031059 788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)

果然存在未释放资源。一个占用了25981280125 大约24G,一个占用了 12643031059 大约12G,这不就是占满了嘛!而且都是catalina.out 日志文件

验证该文件是否存在:

[root@xxxx ~]# ll /home/appuser/tomcat7-MIR-20012/logs/catalina.out
-rw-r--r-- 1 root root 1 4月 52124 12:48 /home/appuser/tomcat7-MIR-20012/logs/catalina.out

文件居然存在的,但是没那么大啊。

再看其他文件:

[root@xxxx ~]# ll /home/appuser/tomcat7-SI-20011/logs/catalina.out
ls: 无法访问/home/appuser/tomcat7-SI-20011/logs/catalina.out: 没有那个文件或目录

这个文件倒是真的不存在。

那么能通过创建文件的方式解决吗?

[root@xxxx ~]# > /home/appuser/tomcat7-SI-20011/logs/catalina.out
[root@xxxx ~]# ll /home/appuser/tomcat7-SI-20011/logs/catalina.out
-rw-r--r-- 1 root root 0 4月 19 13:30 /home/appuser/tomcat7-SI-20011/logs/catalina.out
[root@xxxx ~]# lsof -n | grep deleted
java 27319 root 1w REG 202,3 25981280125 790834 /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
java 27319 root 2w REG 202,3 25981280125 790834 /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
java 27319 root 8w REG 202,3 1224 790864 /home/appuser/tomcat7-MIR-20012/logs/localhost.2017-10-23.log (deleted)
java 27319 root 42w REG 202,3 273 789028 /home/appuser/tomcat7-MIR-20012/logs/localhost_access_log.2018-03-14.txt (deleted)
java 39917 root 8w REG 202,3 1221 790840 /home/appuser/tomcat7-IMR-20010/logs/localhost.2017-10-18.log (deleted)
java 55250 root 7w REG 202,3 19906 790794 /home/appuser/tomcat7-MIR-20012/logs/catalina.2018-02-03.log (deleted)
java 55250 root 8w REG 202,3 1837 790795 /home/appuser/tomcat7-MIR-20012/logs/localhost.2018-02-03.log (deleted)
java 55516 root 1w REG 202,3 12643031059 788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)
java 55516 root 2w REG 202,3 12643031059 788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted))

创建文件并不能释放资源。

清空文件呢?

[root@xxxx ~]# > /home/appuser/tomcat7-MIR-20012/logs/catalina.out
[root@xxxx ~]# ll /home/appuser/tomcat7-MIR-20012/logs/catalina.out
-rw-r--r-- 1 root root 0 4月 19 13:32 /home/appuser/tomcat7-MIR-20012/logs/catalina.out
[root@xxxx ~]# lsof -n | grep deleted
java 27319 root 1w REG 202,3 25981280125 790834 /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
java 27319 root 2w REG 202,3 25981280125 790834 /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
java 27319 root 8w REG 202,3 1224 790864 /home/appuser/tomcat7-MIR-20012/logs/localhost.2017-10-23.log (deleted)
java 27319 root 42w REG 202,3 273 789028 /home/appuser/tomcat7-MIR-20012/logs/localhost_access_log.2018-03-14.txt (deleted)
java 39917 root 8w REG 202,3 1221 790840 /home/appuser/tomcat7-IMR-20010/logs/localhost.2017-10-18.log (deleted)
java 55250 root 7w REG 202,3 19906 790794 /home/appuser/tomcat7-MIR-20012/logs/catalina.2018-02-03.log (deleted)
java 55250 root 8w REG 202,3 1837 790795 /home/appuser/tomcat7-MIR-20012/logs/localhost.2018-02-03.log (deleted)
java 55516 root 1w REG 202,3 12643031059 788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)
java 55516 root 2w REG 202,3 12643031059 788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted))

清空文件也不能释放资源。

正常来说直接把进程杀了,资源立刻就能被释放。但是这是生产环境,问了开发人员进程不能杀,那怎么办呢?
最彻底的方法当然就是重启进程,杀进程或重启服务器。但是不能杀的情况下,怎么释放资源呢?

当linux打开一个文件的时候,Linux内核会为每一个进程在/proc 目录下创建建立一个以其pid
为名的目录用来保存进程的相关信息,而其子目录fd保存的是该进程打开的所有文件的fd(fd:file descriptor)。
目录格式类似/proc/27319/fd

那么我们进到目录下,看有哪些文件被占用:

[root@xxxx fd]# cd /proc/27319/fd
[root@xxxx fd]# ls
0 10 12 14 16 18 2 21 23 25 27 29 30 32 34 36 38 4 41 43 45 47 49 50 7 82 84 9
1 11 13 15 17 19 20 22 24 26 28 3 31 33 35 37 39 40 42 44 46 48 5 6 8 83 86
[root@xxxx fd]# ll | grep deleted
l-wx------ 1 root root 64 4月 19 12:25 1 -> /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
l-wx------ 1 root root 64 4月 19 12:25 2 -> /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
l-wx------ 1 root root 64 4月 19 12:25 42 -> /home/appuser/tomcat7-MIR-20012/logs/localhost_access_log.2018-03-14.txt (deleted)
l-wx------ 1 root root 64 4月 19 12:25 8 -> /home/appuser/tomcat7-MIR-20012/logs/localhost.2017-10-23.log (deleted)

果然文件都是以链接的形式存在的,那么我们查看文件

/home/appuser/tomcat7-MIR-20012/logs/catalina.out
就相当于读取的这里的文件 1 

文件1能直接查看吗?

[root@xxxx fd]# more 1
2016-04-19 12:55:01 [cn.sh.xxx.mir.local.rule.allocation.impl.DefautAllocationRule]-[INFO] 技能组:3600上没有空闲的坐席!
2016-04-19 12:55:02 [cn.sh.xxx.mir.local.executor.AllocationTask]-[INFO] 开始分配任务,队列:3600 任务数:1 空闲坐席:0
[root@xxxx fd]# tail 1
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.executor.AllocationTask]-[INFO] 开始分配任务,队列:365 任务数:3 空闲坐席:0
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.rule.allocation.impl.AbstractAllocationRule]-[INFO] 获取租户514000技能队列3600上签入的坐席数据!
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.rule.allocation.impl.DefautAllocationRule]-[INFO] 技能组:3600上没有空闲的坐席!
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.executor.AllocationTask]-[INFO] 开始分配任务,队列:3600 任务数:1 空闲坐席:0
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.rule.allocation.impl.AbstractAllocationRule]-[INFO] 获取租户514000技能队列3650上签入的坐席数据!
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.rule.allocation.impl.DefautAllocationRule]-[INFO] 技能组:3650上没有空闲的坐席!
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.executor.AllocationTask]-[INFO] 开始分配任务,队列:3650 任务数:1 空闲坐席:0
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.rule.allocation.impl.AbstractAllocationRule]-[INFO] 获取租户514000技能队列3490上签入的坐席数据!
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.rule.allocation.impl.DefautAllocationRule]-[INFO] 技能组:3490上没有空闲的坐席!
2018-04-19 14:09:14 [cn.sh.xxx.mir.local.executor.AllocationTask]-[INFO] 开始分配任务,队列:3490 任务数:1 空闲坐席:0

果然能直接查看,而且保留了2016年的日志,怪不得这么大。而且仍在往里面写日志。
再检查我们刚才创建的文件,日志并没写进去。

既然如此,那我们把这个日志文件清理了,空间时不时就降下来了?

[root@xxxx fd]# > 1
[root@xxxx 55516]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/xvda2             40G  6.4G   31G  18% /
tmpfs                 7.8G     0  7.8G   0% /dev/shm
/dev/xvda1            190M   46M  135M  26% /boot
/dev/xvda3             40G   15G   23G  39% /home
/dev/xvda5             40G   49M   38G   1% /tmp


空间顺利释放,同样办法我们把另一个日志也清理掉。

java       55516      root    1w      REG              202,3 12643031059     788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)

[root@xxxx 55516]# cd /proc/55516/fd
[root@xxxx fd]# ls -l | grep deleted
l-wx------ 1 root root 64 4月  19 12:25 1 -> /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)
l-wx------ 1 root root 64 4月  19 12:25 2 -> /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)
[root@xxxx fd]# > 1
[root@xxxx fd]# lsof -n | grep deleted
java       27319      root    1w      REG              202,3  7100981     790834 /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
java       27319      root    2w      REG              202,3  7100981     790834 /home/appuser/tomcat7-MIR-20012/logs/catalina.out (deleted)
java       27319      root    8w      REG              202,3     1224     790864 /home/appuser/tomcat7-MIR-20012/logs/localhost.2017-10-23.log (deleted)
java       27319      root   42w      REG              202,3      273     789028 /home/appuser/tomcat7-MIR-20012/logs/localhost_access_log.2018-03-14.txt (deleted)
java       39917      root    8w      REG              202,3     1221     790840 /home/appuser/tomcat7-IMR-20010/logs/localhost.2017-10-18.log (deleted)
java       55250      root    7w      REG              202,3    19906     790794 /home/appuser/tomcat7-MIR-20012/logs/catalina.2018-02-03.log (deleted)
java       55250      root    8w      REG              202,3     1837     790795 /home/appuser/tomcat7-MIR-20012/logs/localhost.2018-02-03.log (deleted)
java       55516      root    1w      REG              202,3     2480     788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)
java       55516      root    2w      REG              202,3     2480     788725 /home/appuser/tomcat7-SI-20011/logs/catalina.out (deleted)
[root@xxxx fd]# df -h
Filesystem            Size  Used Avail Use% Mounted on
/dev/xvda2             40G  6.4G   31G  18% /
tmpfs                 7.8G     0  7.8G   0% /dev/shm
/dev/xvda1            190M   46M  135M  26% /boot
/dev/xvda3             40G  2.5G   35G   7% /home
/dev/xvda5             40G   49M   38G   1% /tmp

完成!

通过以上方法,在不杀进程的情况下,顺利释放了磁盘空间。但这只是一个临时的处理方式。
该文件不释放仍会持续增长下去。
仍然需要项目组预约一个维护窗口,把所有进程都杀掉,彻底释放资源才算彻底解决。

 

 参考:

https://www.cnblogs.com/xxdfly/p/6564294.html

https://blog.csdn.net/wyzxg/article/details/4971843

 

 

原文地址:https://www.cnblogs.com/plluoye/p/8882753.html