CentOS僵尸进程与解决方法

Linux僵尸进程与解决方法

　　1，产生原因：

　　在UNIX 系统中，一个进程结束了，但是他的父进程没有等待(调用wait / waitpid)他，那么他将变成一个僵尸进程。通过ps命令查看其带有defunct的标志。僵尸进程是一个早已死亡的进程，但在进程表(processs table)中仍占了一个位置(slot)。

　　但是如果该进程的父进程已经先结束了，那么该进程就不会变成僵尸进程。因为每个进程结束的时候，系统都会扫描当前系统中所运行的所有进程，看看有没有哪个进程是刚刚结束的这个进程的子进程，如果是的话，就由Init进程来接管他，成为他的父进程，从而保证每个进程都会有一个父进程。而Init进程会自动wait其子进程，因此被Init接管的所有进程都不会变成僵尸进程。

　　2，原理分析：

　　每个Unix进程在进程表里都有一个进入点(entry)，核心进程执行该进程时使用到的一切信息都存储在进入点。当用 ps 命令察看系统中的进程信息时，看到的就是进程表中的相关数据。当以fork()系统调用建立一个新的进程后，核心进程就会在进程表中给这个新进程分配一个进入点，然后将相关信息存储在该进入点所对应的进程表内。这些信息中有一项是其父进程的识别码。

　　子进程的结束和父进程的运行是一个异步过程，即父进程永远无法预测子进程到底什么时候结束。那么会不会因为父进程太忙来不及 wait 子进程，或者说不知道子进程什么时候结束，而丢失子进程结束时的状态信息呢？不会。因为UNIX提供了一种机制可以保证，只要父进程想知道子进程结束时的状态信息，就可以得到。这种机制就是：当子进程走完了自己的生命周期后，它会执行exit()系统调用，内核释放该进程所有的资源，包括打开的文件，占用的内存等。但是仍然为其保留一定的信息(包括进程号the process ID，退出码exit code，退出状态the terminationstatus of the process，运行时间the amount of CPU time taken by the process等)，这些数据会一直保留到系统将它传递给它的父进程为止，直到父进程通过wait / waitpid来取时才释放。

　　3，解决方法：

　　(1) 父进程通过wait和waitpid等函数等待子进程结束，这会导致父进程挂起。

　　执行wait()或waitpid()系统调用，则子进程在终止后会立即把它在进程表中的数据返回给父进程，此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。

　　(2) 如果父进程很忙，那么可以用signal函数为SIGCHLD安装handler。在子进程结束后，父进程会收到该信号，可以在handler中调用wait回收。

　　(3) 如果父进程不关心子进程什么时候结束，那么可以用signal(SIGCLD, SIG_IGN)或signal(SIGCHLD, SIG_IGN)通知内核，自己对子进程的结束不感兴趣，那么子进程结束后，内核会回收，并不再给父进程发送信号

　　(4)fork两次，父进程fork一个子进程，然后继续工作，子进程fork一个孙进程后退出，那么孙进程被init接管，孙进程结束后，init会回收。不过子进程的回收还要自己做。

最近工作过程中，发现好几台服务器出现僵死进程（如图）。
<a data-cke-saved-href=http://www.jbxue.com/os/linux/ href=http://www.jbxue.com/os/linux/ target=_blank class=infotextkey>linux</a>僵尸进程

使用命令找出僵死进程：
ps -A -o stat,ppid,pid,cmd | grep -e '^[Zz]'

命令注解：
-A 参数列出所有进程
-o 自定义输出字段我们设定显示字段为 stat（状态）, ppid（进程父id）, pid(进程id)，cmd（命令）这四个参数

-C 用来指定所执行的命令名称，你这里也就是让ps仅仅显示php命令所产生的进程的信息
ps -C java -o lstart,pid,cmd【不过貌似打印的不全~】
ps -A -o lstart,pid,args |grep java【这个可以的~】
因为状态为 z或者Z 的进程为僵尸进程，所以我们使用grep抓取stat状态为zZ进程
运行结果：
linux僵尸进程

这里一共出现了9个僵死进程，需要把它们都干掉，执行命令：
kill -9 8310

这时再执行查找僵死的进程，发现所有僵死进程都没了．

补充：
最近又遇到了个问题，一台服务器上产生了100多少僵死进程，而且每一僵死进程的父进程都不一样，如果用上面的方法，一条一条的杀，那还不得累死我啊。
那么就应该想一条简单的命令，直接查找僵死进程，然后将父进程杀死~

复制代码代码示例:

	ps  -A -o stat,ppid,pid,cmd | grep -e '^[Zz]' | awk '{print $2}' | xargs kill -9

(责任编辑：IT)

搜索

热门标签:

CentOS僵尸进程与解决方法