某天集群一直报警,df时发现硬盘b占用100%,300G,但是du一下发现显示才50G,使用lsof /home | grep -i delete查找删除的文件,但句柄未释放的一大堆,而且目录都是/xxx/index,直接指向solr离线索引项目。做solr离线索引的时候,使用了FileUtils.delete()操作,有2个地方,一个是在inform中,core重启的时候;一个是在handle方法中,那时候是想同步索引时失败回滚,确保旧的索引文件全部删除,就是这里删除了句柄未释放的文件,造成磁盘满了。
另:由上面的查询结果我们可以看到,已经删除的java日志文件占用了很大的空间。
引起上面这种现象的主要原因是什么呢?
主要是因为我们在删除这个日志文件的时候是用rm -rf *.log这样的命令删除的,删除日志之后又没有重启java进程,导致inode节点不被释放,空间一直被占用。
如果我们用echo “ ” > /logpath/201109.log这样的命令来清空日志,就不会出现上面这样的问题了。
有些删了文件,但是进程没 reload,那些空间还是占用的,你可以理解为类似 windows 下的进程句柄没释放的概念吧~ 只是 windows 下如果有文件被进程使用,你一般是删不掉的,而 Linux 虽然不做删除限制,但却要等到进程使用完文件才能完全释放,以防止进程奔溃,这是操作系统对资源的管理差异吧~
(责任编辑:IT) |