正在杀死ruby中的整个进程树



所以我正在做一些后台任务,最终不得不生成一个子进程(使用另一个团队提供的二进制文件(。在某个时刻,如果这个过程超时,我想停止它。

看起来很简单。

def run!(command, timeout)
Timeout.timeout(timeout) do
stdin, stdout, wait_thr = Open3.popen2e(command)
@pid = wait_thr.pid
# ... boring and irrelevant...
end
rescue Timeout::Error
Process.kill 'TERM', @pid
Process.wait pid
raise
end

现在,我也非常喜欢在命令前调用time。不错的原木等等。这使得命令像这样(MacOS(

gtime -f 'Time spent %E memory used %M' some/binary --with parameters" 

所以我的流程树变成了类似的东西

ruby (my background job)
__ gtime
__ some/binary

当然,现在当我杀死子进程时,只有gtime被杀死,二进制继续存在。

  1. 如果我可以控制我用作直接子级的可执行文件,我可能会处理TERM并终止其直接子级进程。但它是time/gtime,所以我显然没有。但也许有一些神秘的参数
  2. 文档中提到了流程组,但子进程当然与我的父进程共享相同的流程组。有没有一种方法可以在新的进程组中产生一个进程;杀死整个过程组";选择是否可行

我也可能解析ps输出,构建一个进程树并遍历它,逐个杀死进程,但这似乎有点过头了(对不起(。我真的缺少什么基本的东西吗?

您可以通过传递pgroup: true:(有关可用选项,请参阅Process.spawn的文档(在新的流程组中启动流程

stdin, stdout, wait_thr = Open3.popen2e(command, pgroup: true)

然后,整个过程组可以通过其过程组ID进行kill-ed,方法是在信号前加减号:

如果信号为负(或以减号开头(,则终止进程组而不是进程。

pgid = Process.getpgid(wait_thr.pid)
Process.kill '-TERM', pgid

与其解析ps的输出,不如看看pgrep。做一些侦查工作并发现一些代码,我们发现了这个方便的功能:

# get child pids ordered by youngest descendants first
def child_processes(pid)
pids = `pgrep -P #{pid}`.split("n").map(&:to_i)
pids.flat_map { |p| child_processes(p) } + pids
end

假设我们有一个这样的过程树(来自我的机器的例子(:

9088 pts/3    Sl+    1:13  _ ruby smtserver.rb
9092 pts/3    Sl     0:41      _ /usr/local/bin/chromedriver --port=9516
9101 pts/3    Sl    10:36          _ /usr/lib/chromium-browser/chromium-browser
9111 pts/3    S      0:00              _ /usr/lib/chromium-bro ser/chromium-bro
9113 pts/3    S      0:00              |   _ /usr/lib/chromium-bro ser/chromium
9154 pts/3    Sl    14:06              |       _ /usr/lib/chromium-bro ser/chro
9187 pts/3    Sl     0:07              |       _ /usr/lib/chromium-bro ser/chro
9135 pts/3    Sl     2:08              _ /usr/lib/chromium-browser/chromium-bro
9312 pts/3    Sl     4:44              _ /usr/lib/chromium-browser/chromium-bro

现在做child_processes(9092),我们得到这个:

[9154, 9187, 9113, 9111, 9135, 9312, 9101]

然后,如果需要的话,你有足够的信息可以单独杀死整棵树。

gtime的情况下,只需杀死some/binary就足够了,然后gmtime就会自行退出。假设some/binary没有创造更多的孩子,这样的事情应该可以解决你的问题:

rescue Timeout::Error
Process.kill 'TERM', child_processes(@pid).last
Process.wait @pid

最新更新