我突然变成了实验室集群的管理员,我迷路了。我有管理linux服务器的经验,但没有集群的经验。
我认为集群正在运行CentOS和ROCKS。我不确定SGE是什么,也不确定它是否在集群中使用。
你能给我一个概述或文档如何配置集群和如何管理它吗?我谷歌了一下,但似乎有很多方法来建立一个集群,它是令人困惑的从哪里开始。
我也突然成为了Rocks Clusters的管理员。虽然你的CentOS知识将是方便的,有一些"岩石"的方式做事,你需要阅读。它们大多从CLI命令rocks list|set命令开始,当你学会它们时,它们非常好用。
你可能应该从阅读文档开始(对于最新版本,你可以在'rocks report version'中找到你的版本):http://central6.rocksclusters.org/roll-documentation/base/6.1/
您可以在SGE部分阅读http://central6.rocksclusters.org/roll-documentation/sge/6.1/
我建议你注册rockcs集群讨论邮件列表:https://lists.sdsc.edu/mailman/listinfo/npaci-rocks-discussion