开发中,在io密集型的场景下,我们可以使用多进程(多线程/协成更nber)来提高任务的处理速度。这就需要主进程需要等待所有工作进程执行完毕后才可以去汇总结果后退出。
但如果不规范的编写程序,就可能导致系统产生孤儿进程/僵尸进程。
父/子进程执行的流程
父/子进程执行的流程执行图
孤儿进程/僵尸进程
1、孤儿进程:子进程执行完毕时发现父进程已退出,子进程变成为了孤儿进程。孤儿进程后期会被系统的 init 进程接管,并 wait/waitpid 其执行状态做回收处理。对系统并无危害。
2、僵尸进程:子进程执行完毕时发现父进程未退出,会向父进程发送 SIGCHLD 信号。但父进程没有使用 wait/waitpid 或其他方式处理 SIGCHLD 信号来回收子进程,子进程变成为了对系统有害的僵尸进程。
僵尸进程无法被系统有效的回收,ps 查看时状态为 Z 的即为僵尸进程,或 top命令可直接看到 zombie 的个数。僵尸进程的父进程此时一定仍在运行,产生僵尸进程的元凶其实是他们的父进程,杀掉父进程,僵尸进程就变为了孤儿进程,便可以转交给 init 进程回收处理。
多进程编程
在多进程开发中,我们无法统一确信父进程会先于任何子进程退出,或者不少场景父进程在创建子进程后并不会退出。这就使得我们要在父进程中处理子进程的 SIGCHLD 信号,否则就有可能产生僵尸进程。
用 PHP 来实现一个较为标准的多进程模型。
wait/waitpid 函数会阻塞父进程等待子进程发送 SIGCHLD 信号,父进程处理并回收对应的子进程,当所有的子进程回收完毕后,即 workers_pid 数组为空时,主进程正常退出即可。
形象的理解下:
父进程作为子进程的监护人,在子进程运行结束后负责清理和回收相关资源是理所当然的。
子进程在运行结束时会告诉父进程,我运行完了,把我回收掉吧,腾出地儿来。
父进程可以通过 await/awaitpid 收到子进程运行结束的信号 SIGCHLD,并回收子进程。
可有些父进程不负责任,丢下子进程直接跑掉了,子进程便成了孤儿进程,这时福利院长 init 便过来接管收留了这些子进程,让它们成为了自己的孩子,耐心的倾听它们何时执行完毕,把它们回收。
有些父进程更过分,虽然没跑路,但堵住了自己负责监听 SIGCHLD 信号的耳朵,子进程根本没办法喊应它,就变成了僵尸进程。init 看到父进程还在那,自己也不能过去接管。如果父进程一会儿突然跑掉了,那 init 可以过去接管这些子进程,因为此时这些子进程已经没有监护人,他们是孤儿进程了,init 可以接管它们。但如果父进程一直不走,那这些僵尸子进程就会一直在那里呆着占用着系统资源。
补充
1、父进程退出时子进程仍在运行,则会使得子进程变为孤儿进程,系统的 pid 为 1 的 init 进程 将会接管这些孤儿进程,待其运行结束后回收资源。
2、子进程退出时父进程仍在运行,且父进程没有对子进程发送的 SIGCHLD 信号进行处理(通常我们是调用 wait/waitpid 进行处理的),则会使得子进程成为僵尸进程 zombie,僵尸进程会继续占用系统资源。若父进程稍后退出,则僵尸进程会转为孤儿进程,进入 1 的处理流程。若父进程处于长期运行状态,则这些占用系统资源的僵尸进程会降低系统性能。