主机上正在运行的进程的数量是否有任何限制



在平台文件中,我只有一个主机:

        <host id="Worker1" speed="100Mf" core="101"/>

然后在worker.c中,我创建了101个(或>100个)进程,期望每个核心上都启动一个进程。但我注意到,只有100第一个进程能够使用XBT_INFO:执行任务或写入

int worker(int argc, char *argv[])
{
    for (int i = 0; i < 101; ++i) {
        MSG_process_create("x", slave, NULL, MSG_host_self());
    }
    return 0;
}
int slave(){
    MSG_task_execute(MSG_task_create("kotok", 1e6, 0, NULL));
    MSG_process_kill(MSG_process_self());
    return 0;
}

其他超过100个第一个进程无法管理和杀死:

[  1.000000] (0:maestro@) Oops ! Deadlock or code not perfectly clean.
[  1.000000] (0:maestro@) 1 processes are still running, waiting for something.
[  1.000000] (0:maestro@) Legend of the following listing: "Process <pid> (<name>@<host>): <status>"
[  1.000000] (0:maestro@) Process 102 (x@Worker1): waiting for execution synchro 0x26484d0 (kotok) in state 2 to finish

更新这里的一些代码功能是:

main

int main(int argc, char *argv[])
{
  MSG_init(&argc, argv);
  MSG_create_environment(argv[1]);          /** - Load the platform description */
  MSG_function_register("worker", worker);
  MSG_launch_application(argv[2]);          /** - Deploy the application */
  msg_error_t res = MSG_main();             /** - Run the simulation */
  XBT_INFO("Simulation time %g", MSG_get_clock());
  return res != MSG_OK;
}

deployment.xml

<?xml version='1.0'?>
<!DOCTYPE platform SYSTEM "http://simgrid.gforge.inria.fr/simgrid/simgrid.dtd">
<platform version="4">
    <process host="Worker1" function="worker">
        <argument value="0"/>
    </process>
</platform>

maxmin系统(SimGrid的核心)的大小实际上有一个内部限制,即100,在这种情况下可能会被击中。我只是添加了一个标志来配置这个限制。你能提取上一个版本,并尝试将maxmin/courrenty_limit设置为1000,看看它是否解决了你的问题吗?

主机上可以启动的进程数量与内核数量无关。与在真实机器上一样,由于时间共享机制,您可以"同时"运行多个进程。这里也是一样。当运行进程的数量大于核心的数量(无论是1个还是更多)时,它们必须共享资源。

问题的原因在其他地方,但您没有提供一个完整的最低限度的工作示例(main?deployment file?),很难提供帮助。

相关内容

  • 没有找到相关文章

最新更新