我在AWS中配置了一个带有GPU的Kubernetes集群,其中一个步骤是配置节点以默认启用Nvidia运行时。
因此,当我配置集群自动缩放器时,集群成功扩展,但新节点仍需要配置为使用Nvidia作为默认运行时。
我的目标是自动配置这一步骤,我想知道是否有一种方法可以用Kubernetes实现这一点,比如在实例组中指定启动时要执行的命令。(就像在GCP中,你可以定义一个启动脚本,或者在AWS中称为启动脚本的用户数据(。
谢谢!
我在这里发现了一个有趣的资源,它帮助我实现了上述目标。
因此,可以在实例组配置中定义额外的用户数据部分。
在我的情况下,我即将启用Nvidia运行时,我实现了以下目标:
spec:
additionalUserData:
- content: |
#!/bin/sh
sudo sed -i '2i "default-runtime": "nvidia",' /etc/docker/daemon.json && sudo systemctl restart docker
name: script.sh
type: text/x-shellscript