我的笔记本(托管笔记本)遇到了一个问题。已调度的笔记本被设置为按照特定的时间表运行,但它已根据该时间表停止运行。它已经运行了一个多月了。我设置的任何新笔记本也不会运行。从那以后,我没有对配置做过任何更改。
我已经检查了项目的配额是否正常。
我已经查看了日志,但是我没有发现任何与笔记本调度相关的错误或警告。我还确认了我用来管理笔记本实例的用户帐户具有访问和管理笔记本的适当IAM权限。
谁能告诉我还有什么问题吗?我没有办法联系GCP支持团队。
记事本主要包括两个部分:
- 执行
调度由租户项目中的Cloud Scheduler组成。这是由谷歌管理的。当这个调度被执行时,它执行回调到笔记本API来创建一个执行。
示例:在PST中午12点,租户项目中的云调度程序发出一个API调用来启动执行。
执行由笔记本API创建的顶点训练作业组成。我建议看一下以下内容:
- 你可以创建一个新的执行吗?
- 调度执行列在顶点工作台UI?
- 当执行应该被触发时,您是否看到创建了任何Training job ?
此基础结构未做任何更改。大多数时候,当用户更改顶点训练帐户参数或GCS桶权限时,我看到这失败了。