我正在努力理解CTRL+C是如何终止子进程而不是父进程的。我在一些脚本shell(如bash
)中看到了这种行为,在那里您可以启动一些长时间运行的进程,然后通过输入CTRL-C来终止它,然后控件返回到shell。
你能解释一下它是如何工作的,特别是为什么父进程(shell)没有终止吗?
shell是否必须对CTRL+C事件进行一些特殊处理?如果是,它具体做什么?
默认情况下,信号由内核处理。旧的Unix系统有15个信号;现在他们有了更多。您可以检查</usr/include/signal.h>
(或kill-l)CTRL+C是名称为SIGINT
的信号。
处理每个信号的默认操作也在内核中定义,通常它会终止接收信号的进程。
所有信号(除了SIGKILL
)都可以由程序处理。
这就是外壳的作用:
- 当shell在交互模式下运行时,它对该模式有一个特殊的信号处理
- 运行程序(例如
find
)时,shell:fork
本身- 并且对于子设置默认信号处理
- 用给定的命令替换子项(例如用find)
- 当您按下CTRL+C时,父shell将处理此信号,但子shell将接收到该信号(默认操作为终止)。(孩子也可以执行信号处理)
您也可以在shell脚本中使用trap
信号。。。
你也可以为你的交互式外壳设置信号处理,试着在~/.profile
的顶部输入这个。(确保您已经登录并使用另一个终端进行测试-您可以锁定自己)
trap 'echo "Dont do this"' 2
现在,每次在shell中按CTRL+C时,它都会打印一条消息。别忘了拆下绳子!
如果感兴趣,可以在这里查看源代码中的普通老/bin/sh
信号处理。
在上面的评论中有一些错误信息(现已删除),所以如果有人感兴趣,这里有一个非常好的链接-信号处理是如何工作的。
首先,通读维基百科上关于POSIX终端接口的文章。
SIGINT
信号由终端线路专业生成,并广播给终端前台进程组中的所有进程。您的shell已经为您运行的命令(或命令管道)创建了一个新的进程组,并告诉终端该进程组是其(终端的)前台进程组。每个并发命令管道都有自己的进程组,foreground命令管道是将shell编程到终端中的进程组作为终端的前台进程组的管道。在前台和后台之间切换"作业"(抛开一些细节不谈)是一个shell告诉终端哪个进程组现在是前台进程组的问题。
shell进程本身处于另一个进程组中,因此当这些进程组中的一个处于前台时不会接收到信号。就这么简单。
终端向当前连接到终端的进程发送INT(中断)信号。然后程序接收到它,并可以选择忽略它或退出。
没有进程必须被强制关闭(尽管默认情况下,如果您不处理sigint,我相信行为是调用abort()
,但我需要查找它)。
当然,运行过程与启动它的shell是隔离的
如果希望父shell运行,请使用exec
:启动程序
exec ./myprogram
这样,父shell就被子进程
setpgid
POSIX C过程组最小示例
通过底层API的最小可运行示例可能更容易理解。
这说明了如果子进程没有用setpgid
更改其进程组,信号是如何发送给子进程的。
main.c
#define _XOPEN_SOURCE 700
#include <assert.h>
#include <signal.h>
#include <stdbool.h>
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
volatile sig_atomic_t is_child = 0;
void signal_handler(int sig) {
char parent_str[] = "sigint parentn";
char child_str[] = "sigint childn";
signal(sig, signal_handler);
if (sig == SIGINT) {
if (is_child) {
write(STDOUT_FILENO, child_str, sizeof(child_str) - 1);
} else {
write(STDOUT_FILENO, parent_str, sizeof(parent_str) - 1);
}
}
}
int main(int argc, char **argv) {
pid_t pid, pgid;
(void)argv;
signal(SIGINT, signal_handler);
signal(SIGUSR1, signal_handler);
pid = fork();
assert(pid != -1);
if (pid == 0) {
is_child = 1;
if (argc > 1) {
/* Change the pgid.
* The new one is guaranteed to be different than the previous, which was equal to the parent's,
* because `man setpgid` says:
* > the child has its own unique process ID, and this PID does not match
* > the ID of any existing process group (setpgid(2)) or session.
*/
setpgid(0, 0);
}
printf("child pid, pgid = %ju, %jun", (uintmax_t)getpid(), (uintmax_t)getpgid(0));
assert(kill(getppid(), SIGUSR1) == 0);
while (1);
exit(EXIT_SUCCESS);
}
/* Wait until the child sends a SIGUSR1. */
pause();
pgid = getpgid(0);
printf("parent pid, pgid = %ju, %jun", (uintmax_t)getpid(), (uintmax_t)pgid);
/* man kill explains that negative first argument means to send a signal to a process group. */
kill(-pgid, SIGINT);
while (1);
}
GitHub上游。
编译使用:
gcc -ggdb3 -O0 -std=c99 -Wall -Wextra -Wpedantic -o setpgid setpgid.c
在没有setpgid
的情况下运行
如果没有任何CLI参数,setpgid
就不会完成:
./setpgid
可能的结果:
child pid, pgid = 28250, 28249
parent pid, pgid = 28249, 28249
sigint parent
sigint child
并且程序挂起。
正如我们所看到的,两个进程的pgid是相同的,因为它是通过fork
继承的。
然后,每当您按下Ctrl+C时,它就会再次输出:
sigint parent
sigint child
这显示了如何:
- 用
kill(-pgid, SIGINT)
向整个进程组发送信号 - 默认情况下,终端上的Ctrl+C会向整个进程组发送终止
通过向两个进程发送不同的信号来退出程序,例如使用Ctrl+\的SIGQUIT。
使用setpgid
运行
如果您使用参数运行,例如:
./setpgid 1
然后子级更改其pgid,现在每次只从父级打印一个sigint:
child pid, pgid = 16470, 16470
parent pid, pgid = 16469, 16469
sigint parent
现在,每当你按下Ctrl+C时,只有父级也会收到信号:
sigint parent
您仍然可以像以前一样使用SIGQUIT(Ctrl+\)杀死父级,但是子级现在有了不同的PGID,并且没有接收到该信号!这可以从中看出
ps aux | grep setpgid
你必须明确地用杀死它
kill -9 16470
这清楚地说明了信号组存在的原因:否则,我们会一直手动清理一堆剩余的进程。
在Ubuntu 18.04上测试。